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(54) Fragments d'ADN codant pour les sous-unites du recepteur de la transfenine de Neisseria meningitidis et 
precedes les exprimant 



fe7J La presents invention a pour objet un fragment d'ADN 
c5aant pour une proteine capable d'etre reconnue par un 
antiserum anti-re cepteur de la transfenine de la souche de 
N. meningitidis IM2394 ou IM2169 ainsi d'un procede d'ob- 
tention de ladite proteine par voie reoombinante. A tHre 
d'exemple, un tel fragment d'ADN code pour la sous-unite 
tbpl de la souche IM2394 ou IM2169 ou pour la sous-unite 
tbp2 de la souche IM2394 ou IM2169. 
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La pr6sente invention a pour objet des fragments d'ADN de Neisseria 
meningitidis codant pour les sous-unites du r6cepteur de la transf enine ainsi 
qu'un prqc6d6 de fabrication de chacune des sous-unites par voie 
recombinante. 

D'une manifcre g6n6rale, les m6ningites sont soit d'origine virale, soit 
d'origine bact&ienne. Les bact6ries principalement responsables sont : N. 
meningitidis et Haemophilus influenzae, respectivement impliqu6es dans 
environ 40 et 50 % des cas de meningites bact&riennes. 

On dSnombre en France, environ 600 k 800 cas par an de meningites k 
N. meningitidis. Anx Etats-Unis, le nombre de cas s'Steve k environ 2 500 k 3 
000 par an. 

Uespece Ni meningitidis est subdivisee en s6rogroupes selon la nature 
des polysaccharides capsulaires. Bien qu'il existe une douzaine de 
s6rogroupes, 90 % des cas de m6ningites sont attribuables k 3 serogroupes : 
A,BetC 

II existe des vaccins efficaces k base de polysaccharides capsulaires 
pour prevenir les m&aingites k N. meningitidis sdrogroupes A et C. Ces 
polysaccharides tels quels ne sont que peu ou pas immunog6niques chez les 
enfents de moins de 2 ans et n'induisent pas de m&noire immunitaire. 
Toutefois, ces inconv6nients peuvent etre surmont6s en conjuguant ces 
polysaccharides k une protfiine porteuse. 

Par contre, le polysaccharide de N. meningitidis groupe B n'est pas ou 
peu immunogfene chez Thomme, qu'il soit sous forme conjugu6e ou non. 
Ainsi, il apparait hautement souhaitable de rechercher un vaccin k Fencontre 
des meningites induites par N meningitidis notamment du s6rogroupe B 
autre qu'un vaccin k base de polysaccharide. 

A cette fin, differentes prot6ines de la membrane externe de N. 
meningitidis ont d6ji et6 propos6es. n s'agit en particulier du r6cepteur 
membranaire de la transferrine humaine. 
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D'une manfere generate, la grande majority des bacteries ont besoin 
de fer pour leur croissance et elles ont d6veloppe des syst&mes specifiques 
d'acquisition de ce metal. En ce qui concerne notamment meningitidis qui 
est un pathogfcne strict de i'homme, le fer ne peut fetre preleve qa'k partir de 
5 proteines humaines de transport du fer telles que la transfenine et la 
lactoferrine puisque la quantit6 de fer sous forme libre est nfigligeable chez 
lTiomme (de Tordre de KT 1 ** M), en tout cas insuffisante pour permettre la 
croissance bact6rienne. 

10 Ainsi, N. meningitidis possfede un recepteur de la transfenine humaine 

et un recepteur de la lactoferrine humaine qui lui pennettent de fixer ces 
proteines chSlatrices du fer et de capter par la suite le fer n£cessaire k sa 
croissance. 

15 Le recepteur de la transferrine de la souche Ni meningitidis B16B6 a 

et6 purifi6 par Schryvers et al (WO 90/12591) k partir d'un extrait 
membranaire. Cette prot6ine telle que purifiee apparait essentiellement 
constitute de 2 types de polypeptides : un polypeptide d'un poids moleculaire 
apparent eleve de 100 kD et un polypeptide d'un poids mol6culaire apparent 

20 moindre d'environ 70 KD, telles que reviles aprfcs 61ectrophor£se sur gel de 
de polyacrylamide en presence de SDS. 

Le produit de la purification notamment mise en oeuvre par Schryvers 
est 1 par definition arbitrate et pour les besoins de la presente demande de 
25 brevet, appel6 recepteur de la transfenine et les polypeptides le constituant, 
des sous-unit6s. Dans la suite du texte, les sous-unites de poids moldculaire 
eleve et de poids mol6culaire moindre sont respectivement appel6es Tbpl et 
Tbp2. 

3 0 Toutefois, le proc£d£ de purification decrit par Schryvers et al ne peut 

pas Stre utilise pour la production k grande 6chelle du recepteur de la 
transferrine. La preparation industrielle de ce r6cepteur sous forme puriffee 
passe necessairement par une 6tape de production k 1'aide d 7 un systfcme 
d'expression h6t£rologue. 
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A cette fin, Finvention se propose de foumir les fragments cTADN 
codant pour les sous-unites du recepteur de la transferrine de N. meningitidis. 

D'autre part, depuis les travaux pionniers de Schryvers et al, on a 
decouvert qu'il existait en fait au moins 2 types de souches qui different par 
la constitution de leurs r6cepteurs de la transferrine respectifc. Ceci a €t& mis 
en Evidence en Studiant des extraits membranaires de phisieurs dizaines de 
souches de N. meningitidis d'origines vari6es. Ces extraits membranaires ont 
tout d'abord 6t6 soumis k une electrophorfcse sur gel de polyacrylamide en 
pr&ence de SDS, puis 61ectrotransf6r6s sur feuilles de nitrocellulose. Ces 
feuilles de nitrocellulose ont 6t6 incubdes : 

a) en pr6sence d'un antiserum de lapin dirig6 contre le recepteur de la 
transferrine purifie k partir de la souche N. meningitidis B16B6, aussi 
appei6eIM2394; 

b) en presence d'un antiserum de lapin dirige contre le rScepteur de la 
transferrine purifie k partir de la souche N. meningitidis IM2169 ; ou | 

c) en presence de la transferrine humaine conjugu£e k la peroxydase. 

En ce qui concerne a) et b), la reconnaissance des sous-unit6s du 
r6cepteur de la transferrine est r6v616e par addition d'un anticorps anti- 
immunoglobulines de lapin coupl6 k la peroxydase, puis par addition du 
substrat de cette enzyme. 

Les tableaux I et H ci-dessous indiquent le profil de certaines souches 
representatives tel qu'il apparait sur gel de polyacrylamide k 7,5 % aprfes 
eiectrophorfese en pr6sence de SDS ; les bandes sont caract6ris6es par leur 
poids moleculaires apparents exprim6s en kilodaltons (kD) : 
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Les resultats repertories dans les 2 premieres lignes des tableaux 
montrent qu'il existe 2 types de souches : 

Le premier type (Tableau I) correspond k des souches qui possfcdent 
nn recepteur dont les 2 sous-unites dans les conditions experimentales 
utilisees, sont reconnues par 1' antiserum anti-recepteur IM2394 tandis que 
seule la sous-unite de haut poids moleculaire est reconnue par rantis6rum 
anti-recepteur IM2169. 

Le second type (Tableau II) correspond k des souches qui poss&denl 
im r6cepteur dont les 2 sous-unites dans les conditions experimentales 
utilisees, sont reconnues par l'antis6rum anti-recepteur IM2169 tandis que 
seule la sous-unite de haut poids mol6culaire est reconnue par Tantis^rum 
anti-recepteur IM2394. 

En consequence, il existe une diversite antig6nique au niveau de la 
sous-unite de moindre poids moleculaire. Cette diversite est toutefois 
restreinte puisqu'elle se r6sout en 2 grands types, contrairement k ce qui est j 
suggere par Griffiths et al, FEMS Microbiol Lett (1990) fi£ : 31. 

En vertu de ces constatations, on pouvait supposer qu'un vaccin efficace 
k Tencontre de toutes les infections kN. meningitidis pourrait £tre constitu6 
de manifcre suffisante, de la sous-unite de haut poids moleculaire, quelle que 
soit la souche d'origine du r6cepteur, puisque cette dernfere est reconnue par 
les 2 types d'antiserums. Toutefois, il semble que cela ne puisse £tre le cas 
dans la mesure oii la sous-unite de haut poids moleculaire ue serait pas 
capable d'induire la production d'anticorps de type neutralisant Seule la plus 
petite des 2 sous-unites du recepteur serait capable de remplir cette fonction. 
Puisque cette sous-unite de moindre poids moleculaire se caracterise par une 
variation antigenique significative du premier type au deuxifcme type de 
souche, uu seul type de recepteur de la transferrine ne devrait pas Stre 
suffisant pour vacciner contre toutes les infections k K meningitidis. Par 
consequent, un vaccin devra contenir au moins la sous-unit6 de moindre 
poids moleculaire de chacune des souches EM2394 et IM2169 ou de leurs 
equivalents respectife et, de maniere optionnelle, la sous-unite de haut poids 
moleculaire d'au moins une souche de N. meningitidis. 
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Cest pourquoi l'invention fournit un fragment d'ADN isote codant 
pour une proteine capable d'etre reconnue par un antisdrum anti-recepteur 
de la souche de N. meningitidis IM2394 ou IM2169. 

5 

Un tel fragment d'ADN peut notanunent comprendre une sequence 
nucleotidique codant pour une sequence d'acides aminfis homologue k celle 
telle que montrde : 

10 - dans Tidentificateur de sequence (SEQ ID NO : 1) n° 1, commengant avec 
le residu cysteine en position 1 et finissant avec le residu glutamine en 
position 579; 

- dans le SEQ ID NO : 2, commengant avec le r&idu acide glutanrique en 
15 position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commengant avec le r6sidu adde glutanrique en 
position 1 et finissant avec le r6sidu phenylalanine en position 887 ; ou 

20 - dans le SEQ ID NO : 4, commengant avec le r£sidu cysteine en position 1 
et finissant avec le residu glutamine en position 69L 

A titre indicate on precise qu'un fragment d'ADN selon l'invention 
peut en outre comprendre une s6quence nucl6otidique additionnelle codant 
25 pour n'importe quelle autre sequence d'acides amines ; les deux sequences 
nucl6otidiques considdrees, fonnant un cadre ouvert de lecture de mani&re k 
coder pour une prot6ine hybride ou un pr6curseur. 

De manifere avantageuse, un fragment d'ADN selon l'invention peut 
3 0 etre seiectionne parmi : 

i) Un premier fragment d'ADN isole, ayant une sequence nucl6otidique 
codant pour une prot6ine ayant une sequence d'acides amines homologue 
k celle tele que montr6e dans le SEQ ID NO : 1, commen?ant avec le 
35 r6sidu cysteine en position 1 et finissant avec le r&idu glutamine en 

position 579. 
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ii) Un deuxifeme fragment d'ADN isole ayant une sequence nncleotidique 
codant pour une proteine ayant une sequence d'acides amines k celle 
telle que montrSe dans le SEQ ID NO : 2, commengant avec le r£sidu 
acide glutamique en position 1 et finissant avec le r6sidu phenylalanine 
en position 884. 

iii) Un troisfeme fragment d'ADN isol£ ayant une sequence nucteotidique 
codant pour une proteine ayant une sequence d'acides amines k celle 
telle que montree dans le SEQ ID NO : 3, commengant avec le rSsidu 
acide glutamique en position 1 et finissant avec le r6sidu phenylalanine 
en position 887. 

iv) Un quatrfeme fragment d'ADN isol£ ayant une sequence nucteotidique 
codant pour une prot£ine ayant une sequence d'acides amines k celle 
telle que montrde dans le SEQ ID NO : 4, commengant avec le residu 
cyst6ine en position 1 et finissant avec le residu glutamine en position 
691. 

Par "sequence d'acides amines homologue", on entend une sequence 
pr6sentant un degrd d'homologie d'au moins 75 %, de manifcre avantageuse 
d'au moins 80 %, de manifcre pr6f6r6e d'au moins 90 %, de manidre tout k 
fait prSferee de 100 %, avec la sequence d'acides amines que Ton cite en 
reference. On notera que le terme "homologue" tel que ddfini inclut le cas 
particulier.de fidentite. 

Le degr6 d'homologie peut Stre ais&nent calcute en alignant les 
sequences de manifcre k obtenir le degr6 maximal d'homologie ; pour ce 
faire, 2L peut etre necessaire d'introduire artificiellement des emplacements 
vacants, comme cela est illustrd dans la figure 7. Une fois que l'alignement 
optimal est realise, le degre d'homologie est etabli en comptabilisant tontes 
ies positions dans lesquelles les acides amines des deux sequences se 
retrouvent k 1'identique, par rapport an nombre total de positions. 
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fl serait fastidieux de decrire des sequences homologues autrement 
que de maniere generique, en raison du trop grand nombre de combinations. 
Uhomme du m6tier connait toutefois les regies generales qui pennettent de 
remplacer un acide amine par un autre sans abolir la fonction biologique ou 
immunologique d'une protdine. 

Un fragment d'ADN isole et tout a fait pr6ter6 a une sequence 
nucieotidique codant pour : 

i) La sous-unit6 Tbpl de la souche TM2394 dont la sequence en acides 
amines est telle que montree dans le SEQ ID NO : 2, commencant ayec 
le residu acide glutamique en position 1 et finissant avec le residu 
phenylalanine en position 884 ; 

ii) La sous-unitd Tbp2 de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 1, commencant avec le residu 
cystdine en position 1 et finissant avec le residu glutamine en position 
579; I 

iii) La sous-unite Tbpl de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 3, commencant avec le residu 
acide glutamique en position 1 et finissant avec le residu phenylalanine 
enposition887;ou 

iv) La sous-unit6 Tbp2 de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 4, commencant avec le residu 
cysteine en position 1 et finissant avec le residu glutamine en position 
691. 

Le recepteur de la transferrine 6tant une proteine membranaire, 
chacune de ses sous-unites est initialement produite sous forme d'un 
precurseur constitue d'un peptide signal associe en position N-terminale, a la 
forme mature. 
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Cest pourquoi l'invention a aussi pour objet un bloc d'ADN isote 
codant pour un peptide signal dont la sequence d'acides amines presente un 
degr6 d'homologie d'an moins 80 %, de maniere pr6feree de 100 %, avec la 
sequence montree dans : 

i) le SEQ ID NO : 2, commencant avec le residu methionine en position 

- 24 et finissant avec le residu alanine en position - 1 ; 

ii) le SEQ ID NO : 3, commencant avec le residu methionine en position 

- 24 et finissant avec le residu alanine en position - 1 ; ou 

in) le SEQ ID NO : 4, commencant avec le residu m6tbionine en position 

- 20 et finissant avec le residu alanine en position - L 

Un fragment d'ADN selon l'invention peut etre aussi selectionne 
parmi un cinquieme, sixieme, septieme et huitieme fragments d'ADN codant 
respectivement pour un pr6curseur dont la sequence d'acides amines est 
homologue a la sequence present6e dans le SEQ ID NO : 1, 2, 3 ou 4. 

Par "fragment ou bloc d'ADN isol6" on entend un fragment ou bloc 
d'ADN d'origine genomique qui est i) insere dans un vecteur viral ou 
plasmidique ou ii) place sous le controle d'un promotenr qui lui est 
heterologue. 

De plus, le bloc d'ADN codant pour le peptide signal selon l'invention 
est, en outre, consid6r6 comme isole lorsque ce bloc d'ADN est associe a un 
fragment d'ADN codant pour une proline het6rologue au peptide signal ; de 
maniere a former un cadre de lecture ouvert codant pour un pr6curseur 
hybride. 

L'invention concerne aussi une cassette d'expression qui comprend au 
moins un fragment d'ADN selon l'invention, place sous le contrdle 
d'elements capables d'assurer son expression dans une cellule-h6te 
appropriee. 
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Dans la cassette d'expression, le premier, deuxfeme, troisteme ou 
quatrifcme firagment d'ADN selon Tinvention peut etre ou non assocte k un 
bloc d'ADN codant pour un peptide signal heterologue k la proteine cod6e 
par ledit fragment d'ADN, selon que Ton recherche ou non la secretion de la 
proteine. De preference, cette secretion sera recherch6e. 

Les elements indispensables k Texpression d'un firagment d'ADN 
selon Tinvention sont un promoteur de transcription, des codons de debut et 
de fin de traduction et, de manure optiomielle, un tenninateur de 
transcription. Le promoteur peut etre constitutif ou inductible. On indique 
que le fragment d'ADN codant pour la sous-unite Tbp2 de la souche IM2394 
semble £tre toxique pour une cellule heterologue, notamment pour & coli. 
Dans cecasl^il pourrait etre preferable d'utiliser un promoteur inductible. 

Des elements tels qu'un bloc d'ADN codant pour un peptide signal 
heterologue (region signal) ou un promoteur existent d&jk en assez grand 
nombre et sont connus de Thomme du metier. Ses competences gdnerales lui 
permettront de choisir une region signal ou un promoteur particulier qui j 
seront adapt6s k la cellule-hdte dans laquelle il envisage regression. 

Fnfin, Tinvention fournit un precede de fabrication d'un peptide, d'un 
polypeptide ou d'une proline capables d'etre reconnus par un antiserum 
anti-recepteur de la souche de N. meningitidis IM2394 ou IM2169 qui 
comprend Facte de cultiver une cellule-hdte comportant une cassette 
d'expression selon Tinvention ; ainsi que le peptide, le polypeptide ou la 
proline produit par ce proc6d6 et les compositions vaccinales les contenant 

Aux fins du precede selon Tinvention, la cellule-h6te peut etre une 
cellule de mammifere, une bact6rie ou une levure ; ces deux dernifcres etant 
preferees. IA aussi, le choix d'une lign6e particulfere est k la portee de 
Thomme du metier. 
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Afin de determiner l'objet de la presente invention, on pr6cise que les 
souches de N. meningitidis IM2394 et IM2169 sont publiquement disponibles 
aupres de la Collection Nationale de Culture des Microorganismes (CNCM), 
Institut Pasteur, 25 rue du Dr Roux 75015 Paris sous les num6ros 
5 d'enregistrement respectifs LNP N 1511 et LNP N 1520. 

Un antiserum spdcifique dn r6cepteur de la transferrine de la souche 
de N. meningitidis IM2394 ou JMZ169 peut fetre obtenu tel que d6crit dans les 
exemples ci-aprfcs. 

10 

L'invention est decrite plus en details dans les exemples ci-aprfcs et 
par reference aux Figures 1 £ 8. 

La Figure 1 represente la structure du phage lambda ZAP H et 
15 schematise la mdthodologie de clonage y afferent Lambda ZAP II est un 
vecteur d'insertion 6quip6 de sites de clonage multiples localises dans la 
partie plasmidique (pBiuescript SK). Cette partie plasmidique peut fctre 
excis6e in vivo par co-infection avec un phage-helper et convertie en vecteur j 
plasmidique. Si une sequence codante est fusionnee en phase k lacZ ou si un 
20 fragment d'ADN clone comporte un promoteur fonctionnel dans & coll, il 
peut y avoir production d'une proteine d'int6r&t qui pourra etre d6tect6e k 
l'aide d'anticorps spdcLSques. 

La Figure 2 presente la structure du plasmide pTG1265. pTG1265 
25 derive du plasmide pGB2 (Churchward et al, Gene (1984) 31 : 165) comme 
suit : pGB2 est digdrfe par EcoRI et HindlU, traite k la polymerase Klenow 
puis ligu6 au fragment Sspl - PvuII de 1 kb issu de pT7I3 184 (Mead et al, 
Protein Engineering (1986) I : 67 ; Pharmacia) qui comporte fl-ori, la 
sdquence lacZ, les promoteurs T3 et T7 ainsi que des sites multiples de 
30 clonage. 

La Figure 3 pr6sente la carte g£nomique de la r6gion d'ADN de la 
souche IM2394 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui ont 6t6 don6s. B = BamHl ; E = EcoRI ; H 
35 . = Hindi] R = EcoRV; X=XbaI ; C = Clal. 
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La Figure 4 presente la carte gdnomique de la region d'ADN de la 
souche IM2169 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui out 6te clones. C = Clal ; H = Hindi ; M = 
MM ; X = Xbal ; ? = position imprecise. 

La Figure 5 presente la structure du plasmide paral3. paral3 est un 
plasmide capable de se repliquer dans K coU qui comporte le promoteur de 
l'op6ron arabinose BAD (ParaB) de Salmonella typhimurium (modifi6 an 
niveau de la TATA box), ainsi que le gene AraC En aval du promoteur 
ParaB se trouve des sites multiples d'insertion. La serie des plasmides para 
est decrite par Cagnon et ad, Prot Eng. (1991) 4 : 843. 

La Figure 6 represente la m6thodologie qui a 6t6 mise en oeuvre pour 
construire le vecteur d'expression pTG3786. 

La Figure 7 compare les sequences d'acides amines predites des sous- 
unites Tbpl des souches IM2394 et IM2169. Le degr6 d'homologie peut etre 
estim6 k environ 76 %. I 

La Figure 8 compare les sequences d'acides amines predites des sous- 
unites Tbp2 des souches IM2394 et IM2169. Le degr6 d'homologie peut etre 
estime k environ 47 %. 

La Figure 9 represente la methodologie qui a et6 mise en oeuvre pour 
contruire le vecteur d'expression pTG3779. 
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FYF.MPLE 1 : Clonage des fragments d'ADN codant pour les sous-unites 
Tbpl et Tbp2 du r6cepteur de la transferrine de la souche 
IM2394 

1A - Culture de la souche et purification du recepteur de la transferrine 

Un lyophilisat de la souche N. meningitidis IM2394 est repris dans 
environ 1 ml de bouillon Muller-Hinton (BMH, Difco). La suspension 
bacterienne est ensuite etalee sur le milieu solide Muller-Hinton contenant 
du sang cuit (5 %). 

Apres 24 hr d'incubation a 37°C dans une atmosphere contenant 10 % 
de CO2, la nappe bacterienne est recueillie pour ensemencer 150 ml de 
BMH pH 7.2, repartis en 3 erlens de 250 mL Uincubation est poursuivie 
pendant 3 hr" a 37°C sous agitation. Chacune des 3 cultures ainsi realisees 
pennet (Tensemencer 400 ml de BMH pH 7,2 suppl6ment6 avec 30 Mm de 
Ethylenediamine - Di (O-Hydroxyphenyl - acetic acid (EDDA, Sigma), qui 
est un agent ch61atant du fer sous forme libre. j 

Apres 16 hr de culture a 37°C sous agitation, les cultures sont 
contrdtees pour leur purete par observation au microscope apres une 
coloration de Gram. La suspension est centrifugde, le culot contenant les 
gennes est pese et conserve a -20°C 

La purification est mise en oeuvre essentiellement selon la methode 
decrite par Schryvers et al (supra), comme suit : 

Le culot bacterien est dficongele, puis remis en suspension dans 200 
ml de tampon Tris HQ 50 mM, pH 8.0 (tampon A). La suspension est 
centrifugee pendant 20 min a 15 000 xg a 4°C Le culot est recupdre, puis 
remis en suspension dans du tampon A a la concentration finale de 150 g/L 
Des fractions de 150 ml sont traitees pendant 8 min a 800 bars dans un lyseur 
de cellules travaillant sous haute pression (Rannie, modele 830H). Le lysat 
ceUulaire ainsi obtenu est centrimg6 pendant 15 min a 4°C a 15 000 xg. Le 
surnageant est recupdre, puis centrifugd pendant 75 min a 4°C a 200 000 xg. 
Apres elimination du surnageant, le culot est repris dans du tampon A et 
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apres dosage de prolines selon Lowry, la concentration de la suspension est 
ajustee£5mg/mL 

A 1,4 ml de la suspension de membranes on ajoute 1,75 mg de 
transferrine humaine biotinylee selou le proced6 decrit par Schryvers. La 
concentration finale de la fraction membranaire est de 4 mg/mL Le melange 
est incub£ 1 heure a 37°C puis centrifuge a 100 000 xg pendant 75 minutes a 
4°C Le culot de membranes est repris par le tampon A contenant du Nad 
0,1M et incube pendant 60 minutes a temperature ambiante. 

Apres solubilisation, on ajoute a cette suspension un certain volume 
de N-Lauroyl Sarkosine a 30 % (p/v) et dTEDTA 500 mM de facon que les 
concentrations finales en Sarkosyl et EDTA soient de 05 % et 5 mM 
respectivement. Apres une incubation de 15 minutes a 37°C sous agitation, 
on ajoute 1 ml de r&ine strepavidine-agarose (Pierce) prealablement lavee 
en tampon A La suspension est incubee 15 minutes a temperature ambiante 
puis centrifugee a 1 000 xg pendant 10 minutes. La resine est ensuite 
conditionnee dans une colonne et l'eluat direct est £limin6. j 

La resine est lavee par 3 volumes de colonne de tampon Tris-HQ 50 
mM pH 8.0 contenant NaQ 1M, EDTA 10 mM Sarkosyl 0,5 % (tampon B) 
puis par un volume de colonne de tampon B contenant de la guamdine-HCi 
750 mM Le recepteur de la transferrine est ensuite elu£ par le tampon B 
contenant de la giiamdine-HCl 2M L'61uat est collecte en fractions, dans des 
tubes contenant un volume identique de Tris HQ 50 mM, pH 8.0, NaQ 1M 
La densit6 optique a 280 nm de l'61uat est mesuree en sortie de colonne a 
l'aide d'un d6tectem UV. 

Les fractions correspondant au pic dilution sont recueillies, dialysees . 
contre du tampon phosphate 10 mM, pH 8,0 contenant du Sarkosyl 0,05 % et 
lyophuisees Le lyophilisat est repris dans de l'eau a une concentration 10 fois 
supdrieure. La solution est dialysee une seconde fois contre du tampon 
phosphate 50 mM pH 8,0 contenant du Sarkosyl 0,05 % (tampon C) puis la 
solution est filtr6e sur une membrane de porosite 0,22 /im. 

Le contenu en prot6ines est determine et ajust6 a 1 mg/ml par 
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addition de tampon C, sous conditions aseptiques. Cette pr6paration est 
conserve k -70°G 

IB - Preparation d'un antiserum sp&ifique du rdcepteur de la transferrin 

Des lapins neo-zelandais albinos regoivent par voie sous-cutanee et 
intramuscolaire 100 Mg du recepteur EM2394 en pr6sence d'adjuvant complet 
de Freund. 21 jours et 42 jours aprfcs la premiere injection, les lapins 
regoivent k nouveau 100 fig du r6cepteur puriffc mais ces fois-ci en pr&ence 
d'adjuvant incomplet de Freund 15 jours aprfcs la demise injection, le 
s&rum des animaux est pr61ev6, puis d6compl6ment6 et filtr6 sur une 
membrane de porosite 0,45 pm. Le filtrat est par la suite 6puis6 par contact 
avec la souche IM2394 qui pour se faire, a et6 cultivde au pr6alable en 
pr&ence de fer sous forme libre (dans ces conditions, la synthase du 
r6cepteur de la transferrine est r6prim6e). Les modalit6s de contact sont 
comme suit : 10 ml du filtrat sont ajout6s k 10 10 cfii (unites fonnant des 
colonies) d'une culture de la souche IM2394. L'adsorption est poursuivie une 
nuit k 4°C, sous agitation. Les bact6ries sont ensuite 61iminees par 
centrifugation. Le surnageant est r6cup6r6 puis soumis k nouveau k 2 
operations d'adsorption successives comme pr6cedemment d6criL 

1C- Determination des sequences peptidiques permettant ^identification 
des fragments d' ADR 

Des fractions aliquotes du mat6riel obtenu en 1A sont s6ch6es puis 
resolubilis6es dans le tampon de Laemmli deux fois concentr£ (Tris 65mM, 
SDS 3 %, $yc6rol 10 %, 2-mercaptoethanol 5 %). On ajoute un volume 
d'eau Equivalent 

Aprfcs sonication, le materiel est chauffe k 90°C pendant 2 minutes, puis 
soumis k une 61ectrophorfcse sur gel de polyacrylamide. Les sous-unit6s ainsi 
separ6es sont transfdrees sur membrane PVDF (Immobilon, Millipore) 
pendant 16 heures k 400 mA en tampon Tris borate 50 mM, pH 8,3. Les 
sous-unit6s 61ectrotransfer6es sont color6es k l'amido blade et les bandes 
correspondant k Tbpl et Tbp2 sont. r6cup6r6es et soumises au 
micros6quengage de Textremit6 N-terminale. 
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Ceci est rep6t6 plusieurs fois pour Stablir les sequences consensus N- 
terminales suivantes : 

TbplIM2394: EXVQAEQAQEKQLDTIQV 
Tbp2 IM2394 : XLXXXXSFDLDSVEXVQXMX 

(X = acide amine non-d6tennine). 

Afin de s6quencer des regions internes de Tbp2, la proteine sur 
membrane PVDF est soumise a digestion par la trypsine en tampon Tris 0,1 
M pH 8,2. Apres 4 heures de reaction a 37°C, les peptides sont extraits par de 
l'acide fonnique 70 % puis par de l'acide trifluoroacetique (TFA) 0,1 %. Ces 
peptides sont ensuite sdpar6s par HPLC 

Pour Tbp2 IM2394, les sequences internes qui ont 6t6 6tablies sont les 

suivantes : 

S1122 : NNIVLFGPDGYLYYK 

S1125 : YITQA 

S'770 : DGENAAGPATEXVIDAYR 

S'766 : XQIDSFGDVK 

S1126 : AAFXXXI 

S"769 : XNXXXMFLQGVR 

S"771 : TPVSDVAAR 

S"767 : XSPAFT 

S"762: NAIEMGGSFXFPGNAPEG(K) 

S1128 : XQPESQQDVSENX 

ID- Prfparationdel'ADNgenomique. 

Le culot bact6rien obtemi en 1A est resuspendu dans environ 25 ml de 
solution A (Tris HQ 25 mM, pH 8 contenant 50 mM de glucose et 10 mM 
d'EDTA) additionn6e de 10 mg de prot6inase K. Le melange est laiss6 10 
minutes a temp6rature ambiante. 
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Pais on ajoute 12^ ml de solution A contenant 10 mg de lysosyme. Une 
nouvelle fois, le m61ange est laisse 10 minutes a temp6rature ambiante. On 
complete alors par 0,5 ml de sarkosyl 10 %. Le melange est incube 10 
minutes <L +4°Q 

On ajonte ensuite 2 mg de RNAse et on laisse l'incubation se 
poursuivre 90 minutes a 37°C L'ADN est purifie par quatre extractions 
phenolizes successives. L'ADN present dans la derniere phase aqueuse est 
preapit6 par I'ethanoL L'ADN de haut poids moleculaire est obtenu par 
separation sur gradient de CsQ. 

IE - Clonage. 

Une premiere banque d'ADN a 6t6 realisee dans le vecteur lambda 
ZAP (Figure 1), comme suit : 

Une pr6paration d'ADN genomique a ete fragmentee aux ultra- 
sons. Les extr6mit6s des fragments ainsi obtenus ont 6t6 rendues tranches par , 
traitement a la T 4 polym6rase. Les fragments ont &6 m6thyl6s. Aprfes 
mediation, les fragments ont ete lies a des adaptateurs EcoRI, traites par 
EcoRIvws ins6res dans le siteEcoRI du phage lambda ZAP E (Stratagene). 

La souche K coU XLl-Blue (Stratagene) a ete infectee avec la 
banque d'ADN ainsi preparee. Les plages de lyse blanches (presence de 
phages recombinants) ont ete testees a l'aide d'un antiserum specifique du 
recepteur de la transferrine de la souche IM2394 preparfe tel que decrit en 
IB. Ceci a permis d'identifier deux clones lambda ZAP IL Les plasmides 
pBluescript contenus dans ces clones ont ete excises par co-infection avec le 
phage-lielper" et ont ete appeles pBMTl et pBM12. 

Les plasmides pBMTl et pBMT2 contiennent chacun un fragment 
EcoRI - EcoRI respectivement de 3,8 Id) et 13 kb. Bs sont presentes dans la 
Figure 3. 

Le s6quencage de l'insert EcoRI - EcoRI de pBMTl a ete mis en 
oeuvre selon la methode de shotgun (BanHer et Barrett, Biochemistry (1983) 
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B5_ : 508), comme suit : 

L'insert EcoRI - EcoRI de pBMTl a 6te purifie puis fragments aux 
ultra-sons. Les extr6uutes des fragments ainsi obtenus ont 6t6 rendues 
tranches par traitement a la T4 polymerase. Les fragments ainsi traites ont 
ete introduits dans un site du phage M13TG131 (decrit dans Kieny et al, 
Gene (1983) 2£ : 91). Environ 200 clones issus de cette preparation ont ete 
sequences. L'analyse de ces sequences par ordinateur a pennis de 
reconstituer la sequence complete de l'insert EcoRI - EcoRI de pBMTl. 

La sequence cod ant pour rextremite N-terminale de Tbpl a 6t6 
localisee comme le montre la Figure 3. Compte tenu de la masse nwleculaire 
de Tbpl, il 6tait clair que.cet insert ne comportait pas le fragment d'ADN 
complet codant pour Tbpl. En amont de l'extremite 5" du gene tbpl, on a mis 
en evidence un cadre de lecture ouvert mais il n'a pas et6 possible 
d'identifier clairement une region codant pour l'extremite N-terminale du 
gene tbpl. 

Le micros6quencage de regions internes de Tbp2 a done 6t6 
entrepris comme reporte prec6demment en 1G Les sequences internes qui 
etaient localis6es vers l'extremite C-terminale, correspondaient bien a la 
partie 3' du cadre de lecture ouvert en amont de tbpl. 

D'autre part, l'ADN genomique de la souche IM2394, 
pr6alablement dig6r6 par Hindi a et6 analyse par Southern blot a l'aide 
d'une sonde d'ADN radioactive correspondant a la zone Hindi - Hindi de 
L5 kb de l'insert de 3,8 kb de pBMTl ; deux bandes ont 6t6 ainsi rev616es. 
Ceci a permis de demontrer que l'insert port6 par pBMTl resultait d'un 
assemblage artefactuel de sequences issues de deux loci distincts. La 
sequence 5' de tbp2 6tait done absente. 

La banque d'ADN genomique en lambda ZAP pr6cedemment 
decrite a 6te cribl6e de nouveau ; cette fois-ci en utilisant l'insert EcoRI - 
EcoRI de pBMT2 comme sonde. 29 candidats ont 6t6 retenus panni environ 
200 000 plages test6es. Seul le plasmide d6riv6 pTG2749 semblait poss6der 
un insert nouveau par rapport a pBMTl et pBMT2. L'insert de pTG2749 est 
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tel que represents dans la Figure 3. La region de l'insert en amont du site 
EcoRV (region EcoRV - EcoRT) a 6t6 sous-clon6e dans M13TG131 et 
s6quencee par la mdthode de Sanger et al, PNAS (1977) 24 : 5463 i l'aide de 
primers synthetiques. La sequence correspondant k Textreniite N-tenninale 
de Tbp2 a et6 ainsi retrouvee. 

La sequence du fragment d'ADN codant pour Tbp2 de la souche 
IM2394 est presence dans le SEQ ID NO : 1 ainsi que la s6quence d'acides 
amin6s correspondante. 

Juste en amont de la s6quence codant pour Tbp2 mature, l'insert 
de pTG2749 comporte une region g6nomique distincte issue d'un autre locus. 
La aussi, il s'agit d'une art6fact de donage analogue a celui mis en 6vidence 
(fans le cas de pBMTl . 

Compte tenn des rearrangements observes et de Tabsence de 
sequences 3' de tbpl et 5* de tbp2, la banque d'ADN g6nomique construite en 
lambda ZAP a 6t6 jugee inadapt6e pour la poursuite du clonage. 

Une deuxfeme banque d'ADN g6nomique a done 6te construite 
dans un plasmide k faible nombre de copies, comme suit : une preparation 
d'ADN genomique a 6te partiellement dig6r£e par Sau3A. Des fragments 
d'ADN d'environ 4 k 6 kb ont 6t6 purifi6s aprfcs fractionnement en gradient 
de sucrose et insures dans le site BamHI du plasmide pTG1265. Cette 
preparation plasmidique a servi k transformer la souche d'E. coli 5K. On a 
estim6 que cette banque contenait environ 18 000 clones independants. 

Environ 50 000 clones de la deuxieme banque ont 6t6 testes k l'aide 
d'une sonde radioactive correspondant k l'insert EcoRI - EcoRI de pBMTl 
Un seul clone a 6t6 r6v616 ; soit le plasmide pTG2759 qui possfede un insert 
de 1,8 kb. La taille de cette insert a et6 jugee insuffisante pour contenir le 
gfcne complet codant pour Tbpl. 

Une troisfeme banque d'ADN a 6t6 construite selon la m6thode 
d6crite au paragraphe pr6c6dent k l'exception de la souche d'E coli 5K qui a 
6td remplacde par la souche d'E coli SURE (Stratagfene). On a estim6 que 
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cette banque contenait environ 60 000 clones ind6pendants. 

Environ 70 000 clones de la troisieme banque d'ADN ont ete testes 
a l'aide d'une sonde radioactive correspondant an fragment Mlul - Hindi de 
2,4 kb issu de l'insert de pTG2754 decrit dans l'Exemple 2 ci-apres et 
represents dans la Figure 4. Deux clones ont ete reveles, soient les plasmides 
pTG2780 et pTG2781, representes dans la Figure 3. 

La sequence des inserts de pTG2780 et pTG2781 a ete etablie selon la 
methode de Sanger. Elle est presentSe dans le SEQ ID NO : 2 ainsi que la 
sequence d'acides amines correspondante. 

Une quatrieme banque a 6te construite. Le DNA genomique a 6te 
digere par Sau3A et une fraction contenant des fragments d'environ 7 kb a 
et6 purifi6e sur gradient de sucrose. Cette fraction contenait un fragment 
correspondant au locus tbpl,2 car elle etait reconnue par une sonde d'ADN 
specifique de tbp2. Apres digestion par EcoRV&tXbal et ligation a pTG1265 
digere par Smal et XbaT, E coU 5K a 6t6 transformee. Un criblage des clones ( 
a l'aide d'une sonde specifique de tbp2 a et6 realist. Parmi une serie de 
clones positife, le plasmide pTG3791 a ete etudie en particulier et s'est av6re 
contenir des sequences 5' tbp2 incluant la s6quence codant pour le peptide 
signal putatif de Tbp2. 

KXEMPLE2 : Qonage des fragments d'ADN codant pour les sous-unites 
Tbpl et Tbp2 du recepteur de la transferrine de la souche 
IM2169. 

2A- La culture de la souche IM2169 et la purification du r6cepteur de la 
transferrine ont ete effectu6es dans des conditions identiques a celles 
d6crites dans l'Exemple 1A 

2B - La preparation d'un antisdrum anti-r6cepteur de la souche IM2169 a 
6t6 realis6e selon le protocole decrit dans l'Exemple IB. 

2C- Les sequences peptidiques permettant l'identification des fragments 
d'ADN ont 6t6 d6terminees selon la mdthode report6e dans l'Exemple 1G 
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Les microsdquences qui out ete etablies sont les suivantes. 

Sequence consensus de rextr6mit6 N-terminale de Tbp 1 : 
ENVQAGQAQEKQLXXIQVX 

S6quences des peptides internes de Tbpl : 
S1031 : XLS(E,W)NAGXVLXPADX 
S1032: QLDTIQVK 
S1033 : TAGSSGAINEffiYENXX 
S1034: YVTWENVDXXXXXX 

Sequence consensus de FextremitS N-terminale de Tbp2 : 
SLVXAXSFDLXSV 

Sequences des peptides internes de Tbp2 : 

S1037: XXDNLSNAX 

S1035 : XGDDGYIFYXGEKPX 

S1036 : XQGXYGFAMX 

S1040 : XQATGHENFQYVYSGXFYK 

2D - La preparation de i'ADN genomique de la souche IM2169 a 6t6 
r6alis6e selon le protocole d6crit dans TExemple ID, 

2E- Qonage 

Une premiere banque d'ADN genomique (fragments d'ADN Sau3A 
partiel ; pTG1265 ; K coli 5K) a 6t6 construite comme pr6c6demment d6crit 
dans FExemple L On a estim6 que cette banque contenait environ 40 000 
clones independants, dont environ 70 % poss6daient un insert de 4-6 kb. 

130 000 clones de cette banque ont 6t6 test6s k Taide d'une sonde 
radioactive correspondant k Finsert EcoRI - EcoRI de pBMT2. 42 clones ont 
6t6 analyses, panni lesquels 2 ont 6t6 retenus : les plasmides pTG2753 et 
pTG2754 qui sont tels que montr6s dans la Figure 4. Les analyses en 
Southern blot ont montre que les cartes de restriction des inserts de 
pTG2753 et pTG2754 correspondaient k la carte de restriction de TADN 
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La determination des sequences nucteotidiques et la recherche des 
regions codant pour les extremites N-terminales et les regions internes ont 
5 demontre que : 

Tinsert de 1,9 kb de pTG2753 contient la partie 3' du gfcne tbpl et la 
partie S 9 du gfcne tbpl ; et 

10 - Tinsert de pTG2754 contient la partie 3* du gfcne tbpl et les parties 5* et 
y du gfcne tbpl, en rupture de phase. 

Cette premiere banque n'a done pas pennis de doner des fragments 
d'ADN complets codant pour Tbpl ou Tbp2. 

15 

Une deuxifcme banque genomique a £t& construite comme 
precedemment mais k partir d'ADN g6nomique diger6 par Xbal. Les 
fragments d'ADN ont et6 purifies apr&s firactionnement en gradient de 
sucrose. Chaque fraction (d'environ 500 m0 a 6te testee par Southern blot 
20 avec une sonde radioactive correspondant k Textremite 3' de tbpl (fragment 
de Tinsert de pTG2754). La fraction presentant une reaction dTiybridation et 
contenant des fragments d'environ 6 kb a ete clonee dans pTG1265. La 
souche K coli 5K a 6t6 transformer 

25 Environ 2 400 clones de cette banque ont ete testes k Taide (Tune sonde 

radioactive correspondant an fragment Hindi - MIuI de 0,6 kb issu de 
pTG2754. Cinq clones ont 6t6 caracteris6s, panni lesquels 2 ont 6t6 retenus : 
soient pTG3720 et pTG3721, tels que montres dans la Figure 4, qui 
contiennent tous deux les gfcnes tbpl et tbp2. 

30 

Afin de completer la sequence nucl6otidique codant pour Tbpl, Tinsert 
de pTG3720 a 6t6 s6quenc6 dans la rdgion oil se situait la rupture de phase 
d£couverte dans Tinsert de pTG2754. Ce s6quen$age a permis de mettre en 
Evidence que la rupture de phase de Tinsert de pTG2754 6tait due k une 
35 d616tion de 22 bp. La sequence complete du fragment d'ADN est telle que 
montr6e dans le SEQ ID NO : 3. 
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Le sequencage de i'insert de pTG3720 a ete pouisuivi pour 6tablir la 
s6quence de tbp2. CeUe-d a Men ete identifi6e ; mais la aussi une rapture de 
phase a 6te constatee. 

Finalement la sequence de tb P 2 a ete determinee a partir du plasmide 
pTG3721. Elle est telle que montree dans le SEQ ID NO : 4. 

F.XHMPLE3 : Expression du fragment d'ADN codant pour la sous-unite 
Tbp2 de la souche IM2394. 

3A. Construction du vecteur d'expression pTG3786. 

Le site SphI du plasmide paral3 (Figure 5 ; Cagnon et al, Prot Eng. 
(1991) 4 : 843) a ete d6truit par traitement a la polymdrase Klenow, pour 
donner le plasmide pTG3704. pTG3704 a et6 Iin6aris6 par coupure Ncol, 
trait6 a la polymerase Klenow pour rendre les extremites franches, puis 
dig6r6parflimlZir. 

D'autre part, on a synthetise les oUgonucleotides OTG4015 et 1 
OTG4016 que Ton a apparies. 

OTG4015 \5' AAATACCTATTGCCTACGGCAGCCGCTGGACTGTTATTACT 

CGCTGCCCAACCAGCGATGGCATGCTTTCCCACGCGTTTTCCCA 3' 

OTG4016 :5'AGCTTGGGAAAACGCGTGGGAAAGCATGCCATCGCTGGTTGGGCA 
GCGAGTAATAACAGTCCAGCGGCTGCCGTAGGCAATAGGTATTT 3 ' 

Le fragment d'ADN double brin OTG4015/OTG4016 a 6t6 ins6re dans 
. paraB traite comme precedemment d6crit, pour donner le plasmide 
pTG3717 dans lequel on avait reconstitae la sequence codant pour la partie 
N-terminale du precurseur de la prot6ine PelB d'Erwima carotovora (Lei et 
al, J. BacL (1987) Wl ' 4379) ; Soit : 

ATG aaa TAC CTA TTG CCT ACG GCA GCC GCT GGA CTG 

Met Lys Tyr Leu Leu Pro Tbx Ala Ala Ala Gly Leu 
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SphI 

TTA TTA CTC GCT GCC CAA CCA GCG ATG GCA TGCTTT 
Leu Leu Leu Ala Ala Gin Pro Ala Met Ala 

Mlul Hindlll 

CCCACGCGTTTTCCCA AGCTT 

(en soulign6, aparaissent les extr6mites de pTG3704) 

A partir du plasmide pTG2749, on a gen6r6 par PCR k 1'aide des 
amorces OTG4011 et OTG 4012, un fragment incluant la region codant pour 
la partie N-terminale de Tbp2, jusqu'au site Mlul interne, tel que montr6 
dans la Figure 6. 

OTG4011 : 

BamHI SphI 

5' AAAAAGGATCC / GCA TGC CTG GGT GGC GGC GGC AGT TTC 3' 
Cys Leu Gly 

OTG4012 : 

BamHI Mlul 
5 ' AAAAGGATCCG AAT GGT GTA ACG CGT AGT TTT TAT 3 ' 

Le fragment genere par PCR a 6te digere par BamHI, puis insere dans 
le site BamHI du phage M13TG131, pour donner M13TG3724. La sequence 
de ce fragment a ete vSrifiee par sfiquengage, 

A partir de M13TG3724, on a r6cup6re la region codant pour la partie 
N-terminale de Tbp2 sous forme d'un fragment SphI - Mini que Ton insert 
dans pTG3717 pr6alablement dig6r6 par SphI et Mlul, pour donner le 
plasmide pTG3743. 

A partir du plasmide pBMTl, on a recup6r6 la rdgion codant pour la 
partie C-terminale de Tbp2 sous forme d'un fragment Mlul-Banl dont 
Textr6mit6 cohesive BanI avait 6t6 rendue franche .par traitement k la 
polymerase Klenow. On a insere ce fragment dans pTG3743 pr6alablement 
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dig6r6 par Hindin, traite a la polymerase Klenow et finalement digere par 
MIuI. On obtient ainsi le plasmide pTG3786. 

3B. Production de la sous-unite Tbp2. 

K coU MC1061 (Casadaban & Cohen, J. MoL Biol. (1980) I2& : 179) 
est transformee par pTG3786 puis mise en culture a 37°C, en milieu LB 
supplements avec 2 g/1 de glycerol. A la culture est en phase exponentielle, 
on ajoute 0,2 g/1 d'arabinose. L'incubation a 6t6 poursuivie durant 6 hr 
supplementaires. L'expression a ete observee moins d'une heure apres 
l'addition d'arabinose. 

L'electrophorese sur gel d'acrylamide d'un echantillon du lysat 
cellulaire total a mis en evidence la presence d'une proteine d'environ 70 kD 
qui est capable de fixer la transferrine humaine marquee a la peroxydase. 

KXEMPLE4 : Expression du fragment d'ADN codant pour la sous-unit6 
tbpl de la souche IM2169. 

4A. Construction du vecteur d'expression pTG37796. 

Un fragment synm6tique constitu6 des oligonucl6otides OTG4038 et 
OTG4039 prealablement apparies, a 6t6 ins6r6 dans le plasmide pTG3704 
dig6r6 par Ncol et HlndJH, gen6rant ainsi le plasmide pTG3756. 

OTG4038 : 

5' CATGGCTGCAGGRACCACGCGTGAATTCCCCGGGTCTAGA 3' 
OTG4039 : 

5' AGCTTCTAGACCCGGGGAATTCACGCGTGGTACCTGCAGC 3' 

A partir du plasmide pTG2754, on a genere par PCR a l'aide des 
amorces OTG4037 et OTG4014 un fragment incluant la region codant pour 
rextr6mit6 N-terminale du precurseur de Tbpl >»qu'au site MM. 
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OTG4037 : 

5 r TTTCCCGGATCCGC ATG CAA CAG CAA CAT TTG TTC CGA TTA 3 
BamHI SphI 

Met Glh Gin Gin — 



I 



OTG4014 : 

5' AAAAGGATCCGGGGTCGTAACGCGTCAGGTCGCGG 3' 
BamHI Mlul 

Ce fragment PCR a 6te dig6r6 par BamHI et clone dans le site BamHI 
de M13TG131 pour generer M13TG3738. La sequence de ce fragment a 6te 
veiifiee. 

M13TG3738 a ensuite ete linearise par SphI, trait6 a la T4 DNA 
polymerase pour rendre les extrdmites tranches, puis dig6re par Mlul afin 
d'isoler le fragment porteur de la r6gion codant pour l*extr6mite N-temunale 
du pr6curseur de Tbpl. 

Ce fragment a 6te ins6re dans pTG3756 digerd par Ncol, trait6 a la T4 
DNA polymerase puis digere par MM, pour g6nerer le plasmide pTG3778. 
La sequence de la jonction Ncor/SphT a ete verifiee. 

Le fragment Mlul-Xbalde pTG3720 codant pour la majeure partie de 
Tbpl {3'tbpl) a ete insere dans le plasmide pTG3778. Le plasmide final ainsi 
obtenu est le plasmide pTG3779. 

4B. Production de la sous-unite TbpL 

E. coH MC1061 a ete transforme par pTG3779 puis mise en culture a 
3TC en milieu LB. Ala culture en phase exponentielle, on a ajoute 0,2 g/1 
d'arabinose. Uincubation a 6t6 poursuivie durant 4 hemes. 

Uelectrophorese sur gel d'acrylamide d'un 6chantillon du lysat 
ceUulaire total a mis en evidence la presence d'une prot6ine d'environ 100 
Kd qui est capable de fixer la transferrin humaine marquee a la peroxydase. 



-28- 



2692592 



SEP ID NO : 1 



Objet : S6quence de PADN genomique de la souche de M meningitidis IM2394 
codant pour la sous unitd Tbp2 et sequence proteique d&Iuite. En gras sont 
indiques le peptide signal et le site Mlul 



ATG AAC AAT CCA TTG 15 

Met Asn Asn Pro Leu 

-20 

GTA AAT CAG GCT GCT ATG GTG CTG CCT GTG TTT TTG TTG AGT GCT 60 
Val Asn Gin Ala Ala Met Val Leu Pro Val Phe Leu Leu Ser Ala 
-15 -10 -5 -1 

TGT CTG GGT GGC GGC GGC AGT TTC GAT TTG GAC AGC GTG GAA ACC 105 
Cys Leu Gly Gly Gly Gly Ser Phe Asp Leu Asp Ser Val Glu Thr 
1 5 10 15 

GTG CAA GAT ATG CAC TCC AAA CCT AAG TAT GAG GAT GAA AAA AGC 130 
Val Gin Asp Met His Ser Lys Pro Lys Tyr Glu Asp Glu Lys Ser 
20 25 30 

CAG CCT GAA AGC CAA CAG GAT GTA TCG GAA AAC AGC GGC GCG GCT 195 
Gin Pro Glu Ser Gin Gin Asp Val Ser Glu Asn Ser Gly Ala Ala 
35 40 45 

TAT GGC TTT GCA GTA AAA CTA CCT CGC CGG AAT GCA CAT TTT AAT 240 
Tyr Gly Phe Ala Val Lys Leu Pro Arg Arg Asn Ala His Phe Asn 
50 55 60 

CCT AAA TAT AAG GAA AAG CAC AAA CCA TTG GGT TCA ATG GAT TGG 285 
Pro Lys Tyr Lys Glu Lys His Lys Pro Leu Gly Ser Met Asp Trp 
65 . 70 75 

AAA AAA CTG CAA AGA GGA GAA CCA AAT AGT TTT AGT GAG AGG GAT 330 
Lys Lys Leu Gin Arg Gly Glu Pro Asn Ser Phe Ser Glu Arg Asp 
80 85 90 

GAA TTG GAA AAA AAA CGG GGT AGT TCT GAA CTT ATT GAA TCA AAA 375 
Glu Leu Glu Lys Lys Arg Gly Ser Ser Glu Leu lie Glu Ser Lys 
95 100 105 

TGG GAA GAT GGG CAA AGT CGT GTA GTT GGT TAT ACA AAT TTC ACT 420 
Trp Glu Asp Gly Gin Ser Arg Val Val Gly Tyr Thr Asn Phe Thr 
110 115 120 

TAT GTC CGT TCG GGA TAT GTT TAC CTT AAT AAA AAT AAT ATT GAT 465 
Tyr Val Arg Ser Gly Tyr Val Tyr Leu Asn Lys Asn Asn lie Asp 
125 130 135 

ATT AAG AAT AAT ATA GTT CTT TTT GGA CCT GAC GGA TAT CTT TAC 510 
lie Lys Asn Asn lie Val Leu Phe Gly Pro Asp Gly Tyr Leu Tyr 
140 145 150 



-29- 



2692592 



TAT AAA GGG AAA GAA CCT TCC AAG GAG CTG CCA TCG GAA AAG ATA 555 
Tvr Lys Gly Lya Glu Pro Ser Lys Glu Leu Pro Ser Glu Lye lie 
1 1 155 160 165 

ACT TAT AAA GGT ACT TGG GAT TAT GTT ACT GAT GCT ATG GAA AAA 600 
Thr Tyr Lys Gly Thr Trp Asp Tyr Val Thr Asp Ala Met Glu Lys 
170 175 

CAA AGG TTT GAA GGA TTG GGT AGT GCA GCA GGA GGA GAT AAA TCG 645 
Gin Arg Phe Glu Gly Leu Gly Ser Ala Ala Gly Gly Asp Lys Ser 
185 190 195 

GGG GCG TTG TCT GCA TTA GAA GAA GGG GTA TTG CGT AAT CAG GCA 690 
Gly Ala Leu Ser Ala Leu Glu Glu Gly Val Leu Arg Asn Gin Ala 
200 205 210 

GAG GCA TCA TCC GGT CAT ACC GAT TTT GGT ATG ACT AGT GAG TTT 735 
Glu Ala Ser Ser Gly His Thr Asp Phe Gly Met Thr Ser Glu Phe 
215 220 225 

GAG GTT GAT TTT TCT GAT AAA ACA ATA AAG GGC ACA CTT TAT CGT 780 
Glu Val Asp Phe Ser Asp Lys Thr He Lys Gly Thr Leu Tyr Arg 
230 235 240 

AAC AAC CGT ATT ACT CAA AAT AAT AGT GAA AAC AAA CAA ATA AAA 825 
Asn Asn Arg He Thr Gin Asn Asn Ser Glu Asn Lys Gin He Lys 
245 250 255 

ACT ACG CGT TAC ACC ATT CAA GCA ACT CTT CAC GGC AAC CGT TTC 870 
Thr Thr Arg Tyr Thr He Gin Ala THr Leu His Gly Asn Arg Phe 
260 265 270 

AAA GGT AAG GCG TTG GCG GCA GAT AAA GGT GCA ACA AAT GGA AGT 915 
Lys Gly Lys Ala Leu Ala Ala Asp Lys Gly Ala Thr Asn Gly Ser 
275 280 285 

CAT CCC TTT ATT TCC GAC TCC GAC AGT TTG GAA GGC GGA TTT TAC 960 
His Pro Phe He Ser Asp Ser Asp Ser Leu Glu Gly Gly Phe Tyr 
290 295 300 

GGG CCG AAA GGC GAG GAA CTT GCC GGT AAA TTC TTG AGC AAC GAC 1005 
Gly Pro Lys Gly Glu Glu Leu Ala Gly Lys Phe Leu Ser Asn Asp 
305 . 310 315 

AAC AAA GTT GCA GCG GTG TTT GGT GCG AAG CAG AAA GAT AAG AAG 1050 
Asn Lys Val Ala Ala Val Phe Gly Ala Lys Gin Lys Asp Lys Lys 

GAT GGG GAA AAC GCG GCA GGG CCT GCA ACG GAA ACC GTG ATA GAT 1095 
Asp Gly Glu Asn Ala Ala Gly Pro Ala Thr Glu Thr Val He Asp 
335 340 345 

GCA TAC CGT ATT ACC GGC GAG GAG TTT AAG AAA GAG CAA ATA GAC 1140 
Ala Tyr Arg He Thr Gly Glu Glu Phe Lys Lys Glu Gin He Asp 
350 355 360 

AGT TTT GGA GAT GTG AAA AAG CTG CTG GTT GAC GGA GTG GAG CTT 1185 
Ser Phe Gly Asp Val Lys Lys Leu Leu Val Asp Gly Val Glu Leu 
365 370 375 

TCA CTG CTG CCG TCT GAG GGC AAT AAG GCG GCA TTT CAG CAC GAG 1230 
ier Su Leu Pro Ser Glu Gly Asn Lys Ala Ala Phe Gin His Glu 
380 385 
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ATT GAG CAA AAC GGC GTG AAG GCA ACG GTG TGT TGT TCC AAC TTG 1275 
lie Glu Gin Aan Gly Val Lye Ala Thr Val Cys Cys Ser Asn Leu 
395 400 - 405 

GAT TAC ATG AGT TTT GGG AAG CTG TCA AAA GAA AAT AAA GAC GAT 1320 
Asp Tyr Met Ser Phe Gly Lys Leu Ser Lys Gku Asn Lys Asp Asp 
410 415 420 

ATG TTC CTG CAA GGT GTC CGC ACT CCA GTA TCC GAT GTG GCG GCA 1365 
Met Phe Leu Gin Gly Val Arg Thr Pro Val Ser Asp Val Ala Ala 
425 430 435 

AGG ACG GAG GCA AAC GCC AAA TAT CGC GGT ACT TGG TAC GGA TAT 1410 
Arg Thr Glu Ala Lys Tyr Arg Gly Thr Gly Thr Trp Tyr Gly Tyr 
440 445 450 

ATT GCC AAC GGC ACA AGC TGG AGC GGC GAA GCC TCC AAT CAG GAA 1455 
lie Ala Asn Gly Thr Ser Trp Ser Gly Glu Ala Ser Asn Gin Glu 
455 460 465 

GGT GGT AAT AGG GCA GAG TTT GAC GTG GAT TTT TCC ACT AAA AAA 1500 
Gly Gly Asn Arg Ala Glu Phe Asp Val Asp Phe Ser Thr Lys Lys 
470 475 480 

ATC AGT GGC ACA CTG ACG GCA AAA GAC CGT ACG TCT CCT GCG TTT 1545 
He Ser Gly Thr Leu Thr Ala Lys Asp Arg Thr Ser Pro Ala Phe 
485 490 495 

ACT ATT ACT GCC ATG ATT AAG GAC AAC GGT TTT TCA GGT GTG GCG 1590 
Thr lie Thr Ala Met lie Lys Asp Asn Gly Phe Ser Gly Val Ala 
500 505 510 

AAA ACC GGT GAA AAC GGC TTT GCG CTG GAT CCG CAA AAT ACC GGA 1635 
Lys Thr Gly Glu Asn Gly Phe Ala Leu Asp Pro Gin Asn Thr Gly 
515 520 525 

AAT TCC CAC TAT ACG CAT ATT GAA GCC ACT GTA TCC GGC GGT TTC 1680 
Asn Ser His Tyr Thr His Xle Glu Ala Thr Val Ser Gly Gly Phe 
530 535 540 

TAC GGC AAA AAC GCC ATC GAG ATG GGC GGA TCG TTC TCA TTT CCG 1725 
Tyr Gly Lys Asn Ala lie Glu Met Gly Gly Ser Phe Ser Phe Pro 
545 550 555 

GGA AAT GCA CCA GAG GGA AAA CAA GAA AAA GCA TCG GTG GTA TTC 1770 
Gly Asn Ala Pro Glu Gly Lys Gin Glu Lys Ala Ser Val Val Phe 
560 565 570 

GGT GCG AAA CGC CAA CAG CTT GTG CAA TAA GCACGGCT 1808 
Gly Ala Lys Arg Gin Gin Leu Val Gin 
575 
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SEO ID NO : 2 



Objet : Sequence de TADN genomique de la souche de N. meningitidis IM2394 
codant pour le precurseur de la sous-unit£ Tbpl du recepteur de la transferrine 
et sequence protfique d6duite. Le peptide signal est indiqufi en caractferes gras. 

CTTCCGATG CCGTCTGAAA GCGAAGATTA GGGAAACACT 40 

ATG CAA CAG CAA CAT TTG TTC CGA TTA AAT ATT TTA TGC CTG TCT 85 
Mat Gin Gin Gin His Leu Phe Arg Leu Asn lie Leu Cys Leu Ser 
-24 -20 -15 -10 

TTA ATG ACC GCG CTG CCC GTT TAT GCA GAA AAT GTG CAA GCC GAA 130 
Leu Met Thr Ala Leu Pro Val Tyr Ala Glu Asn Val Gin Ala Glu 
-5 -11 5 

CAA GCA CAG GAA AAA CAG TTG GAT ACC ATA CAG GTA AAA GCC AAA 175 " 

Gin Ala Gin Glu Lys Gin Leu Asp Thr lie Gin Val Lys Ala Lys 
10 15 20 

AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGG CTG GGC AAG 220 
Lys Gin Lys Thr Arg Arg Asp Asn Glu Val Thr Gly Leu Gly Lys 
25 30 35 

TTG GTC AAG TCT TCC GAT ACG CTA AGT AAA GAA CAG GTT TTG AAT 265 
Leu Val Lys Ser Ser Asp Thr Leu Ser Lys Glu Gin Val Leu Asn 
40 45 50 

ATC CGA GAC CTG ACC CGT TAT GAT CCG GGT ATT GCC GTG GTC GAA 310 
lie Arg Asp Leu Thr Arg Tyr Asp Pro Gly He Ala Val Val Glu 
55 60 65 

CAG GGT CGG GGC GCA AGT TCC GGC TAT TCA ATA CGC GGC ATG GAT 355 
Gin Gly Arg Gly Ala Ser Ser Gly Tyr Ser He Arg Gly Met Asp 
70 75 80 

AAA AAC CGC GTT TCC TTA ACG GTA GAC GGC GTT TCG CAA ATA CAG 400 
Lys Asn Arg Val Ser Leu Thr Val Asp Gly Val Ser Gin He Gin 
85 90 95 

TCC TAC ACC GCG CAG GCG GCA TTG GGT GGG ACG AGG ACG GCG GGT 445 
Ser Tyr Thr Ala Gin Ala Ala Leu Gly Gly Thr Arg Thr Ala Gly 
100 105 110 

AGC AGC GGC GCA ATC AAT GAA ATC GAG TAT GAA AAC GTC AAG GCC 490 
Ser Ser Gly Ala He Asn Glu He Glu Tyr Glu Asn Val Lys Ala 
115 . 120 125 

GTT GAA ATC AGC AAG GGT TCG AAT TCA TCA GAA TAC GGA AAC GGC 535 
Val Glu He Ser Lya Gly Ser Asn Ser Ser Glu Tyr Gly ABn Gly 
130 135 140 

GCA TTG GCA GGT TCG GTC GCA TTT CAA ACC AAA ACC GCA GCC GAC 580 
Ala Leu Ala Gly Ser Val Ala Phe Gin Thr Lys Thr Ala Ala Asp 
145 150 155 
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ATT ATC GGA GAG GGA AAA CAG TGG GGC ATT CAG AGT AAA ACT GCC 625 
lie lie Gly Glu Gly Lys Gin Trp Gly He Gin Ser Lys Thr Ala 
160 165 170 

TAT TCG GGA AAA GAQ CAT GCC CTG ACG CAA TCC CTT GCG CTT GCC 670 
Tyr Ser Gly Lys Asp His Ala Leu Thr Gin Ser Leu Ala Leu Ala 
175 180 185 

GGA CGC AGC GGC GGC GCG GAA GCC CTC CTT ATT TAT ACT AAA CGG 715 
Gly Arg Ser Gly Gly Ala Glu Ala Leu Leu He Tyr Thr Lys Arg 
190 195 200 

CGG GGT CGG GAA ATC CAT GCG CAT AAA GAT GCC GGC AAG GGT GTG 760 
Arg Gly Arg Glu He His Ala His Lys Asp Ala Gly Lys Gly Val 
205 210 215 

CAG AGC TTC AAC CGG CTG GTG TTG GAC GAG GAC AAG AAG GAG GGT 805 
Gin Ser Phe Asn Arg Leu Val Leu Asp Glu Asp Lys Lys Glu Gly 
220 225 230 

GGC AGT CAG TAC AGA TAT TTC ATT GTC GAA GAA GAA TGC CAC AAT 850 
Gly Ser Gin Tyr Arg Tyr Phe lie Val Glu Glu Glu Cys His Asn 
235 240 245 

GGA TAT GCG GCC TGT AAA AAC AAG CTG AAA GAA GAT GCC TCG GTC 895 
Gly Tyr Ala Ala Cys Lys Asn Lys Leu Lys Glu Asp Ala Ser Val 
250 255 260 

AAA GAT GAG CGC AAA ACC GTC AGC ACG CAG GAT TAT ACC GGC TCC 940 
Lys Asp Glu Arg Lys Thr Val Ser Thr Gin Asp Tyr Thr Gly Ser 
265 270 275 

AAC CGC TTA CTT GCG AAC CCG CTT GAG TAT GGC AGC CAA TCA TGG 985 
Asn Arg Leu Leu Ala Asn Pro Leu Glu Tyr Gly Ser Gin Ser Trp 
280 285 290 

CTG TTC CGA CCG GGT TGG CAT TTG GAC AAC CGC CAT TAT GTC GGA 1030 
Leu Phe Arg Pro Gly Trp His Leu Asp Asn Arg His Tyr Val Gly 
295 300 305 

GCC GTT CTC GAA CGT ACG CAG CAG ACC TTT GAT ACA CGG GAT ATG 1075 
Ala Val Leu Glu Arg Thr Gin Gin Thr Phe Asp Thr Arg Asp Met 
310 315 320 

ACT GTT CCT GCC TAT TTT ACC AGT GAA GAT TAT GTA CCC GGT TCG 1120 
Thr Val Pro Ala Tyr Phe Thr Ser Glu Asp Tyr Val Pro Gly Ser 
325 330 335 

CTG AAA GGT CTT GGC AAA TAT TCG GGC GAT AAT AAG GCA GAA AGG 1165 
Leu Lys Gly Leu Gly Lys Tyr Ser Gly Asp Asn Lys Ala Glu Arg 
340 345 350 

CTG TTT GTT CAG GGA GAG GGC AGT ACA TTG CAG GGT ATC GGT TAC 1210 
Leu Phe Val Gin Gly Glu Gly Ser Thr Leu Gin Gly He Gly Tyr 
355 360 365 

GGT ACC GGC GTG TTT TAT GAT GAA CGC CAT ACT AAA AAC CGC TAC 1255 
Gly Thr Gly Val Phe Tyr Asp Glu Arg His Thr Lys Asn Arg Tyr 
370 375 380 

GGG GTC GAA TAT GTT TAC CAT AAT GCT GAT AAG GAT ACC TGG GCC 1300 
Gly Val Glu Tyr Val Tyr His Asn Ala Asp Lys Asp Thr Trp Ala 
385 390 395 
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GAT TAC GCC CGA CTT TCT TAT GAC CGG CAA GGT ATA GAT TTG GAC 1345 
Asp Tyr Ala Arg Leu Ser Tyr Asp Arg Gin Gly He Asp Leu Asp 

AAC CGT TTG CAG CAG ACG CAT TGC TCT CAC GAC GGT TCG GAT AAA 1390 
Asn Arg Leu Gin Gin Thr His Cys Ser His Asp Gly Ser Asp Lys 
415 420 *25 

AAT TGC CGT CCC GAC GGC AAT AAA CCG TAT TCT TTC TAT AAA TCC 1435 
Asn Cys Arg Pro Asp Gly Asn Lys Pro Tyr Ser Phe Tyr Lys Ser 
430 435 **° 

GAC CGG ATG ATT TAT GAA GAA "AGC CGA AAC CTG TTC CAA GCA GTA 
Asp Arg Met lie Tyr Glu Glu Ser Arg Asn Leu Phe Gin Ala Val 
445 4S0 455 

TTT AAA AAG GCA TTT GAT ACG GCC AAA ATC CGT CAC AAT TTG AGT 
S£ iys Ala Phe Asp Thr Ala Lys He Arg His Asn Leu Ser 
460 465 *' 

ATC AAT CTA GGG TAC GAC CGC TTT AAG TCG CAA TTG TCC CAC AGC 
lie Asn Leu Gly Tyr Asp Arg Phe Lys Ser Gin Leu Ser Hxs Ser 
475 4800 

GAT TAT TAT CTT CAA AAC GCA GTT CAG GCA TAT GAT TTG ATA ACC 
Asp Tyr Tyr Leu Gin Asn Ala Val Gin Ala Tyr Asp Leu lie Thr 

CCG AAA AAG CCT CCG TTT CCC AAC GGA AGC AAA GAC AAC CCG TAT 
Pro Lys Lys Pro Pro Phe Pro Asn Gly Ser Lys Asp Asn Pro Tyr 
505 510 515 

AGG GTG TCT ATC GGC AAG ACC ACG GTC AAT ACA TCG CCG ATA TGC 
Arg Val ser lie Gly Lys Thr Thr Val Asn Thr Ser Pro lie cys 
520 525 530 

CGT TTC GGC AAT AAC ACC TAT ACA GAC TGC ACA CCG AGG AAT ATC 1750 
Arg Phe Gly Asn Asn Thr Tyr Thr Asp cys Thr Pro Arg Asn He 
535 540 545 

GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA GAC AAT GTC CGT TTG 1795 
Gly Gly Asn Gly Tyr Tyr Ala Ala Val Gin Asp Asn Val Arg Leu 

555 sou 



550 



1480 



1525 



1570 



1615 



1660 



1705 



GGC AGC TGG GCG GAT GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 1840 
Gly Arg Trp Ala Asp Val Gly Ala Gly He Arg Tyr Aap Tyr Arg 
565 570 575 

AGC ACG. CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 1885 
Ser Thr His ser Glu Asp Lys Ser Val Ser Thr Gly Thr His Arg 
580 585 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 1930 
Asn Leu Ser Trp Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 
595 600 605 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 1975 
Met Asp Leu Thr Tyr Arg Ala Ser Thr Gly Phe Arg Leu Pro Ser 
610 615 620 

TTT GCC GAA ATG TAT GGC TGG AGA GCC GGG GAG TCT TTG AAA ACG 
Met 
625 



TTT GCC GAA ATG TAT GGC TGG AGA uu; xw* x*w 

Phe Ala Glu Met Tyr Gly Trp Arg Ala Gly Glu Ser Leu Lys Thr 



2020 
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GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA GAC AAT GTC CGT TTG 1795 
Gly Gly Asn Gly Tyr Tyr Ala Ala Val Gin Asp Asn Val Arg Leu 
550 555 560 

GGC AGG TGG GCG GAT- GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 1840 
Gly Arg Trp Ala Asp Val Gly Ala Gly He Arg Tyr Asp Tyr Arg 
565 570 575 

AGC ACG CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 1885 
Ser Thr His Ser Glu Asp Lye Ser Val Ser Thr Gly Thr Hrs Arg 
580 585 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 1930 
ten Su Trp Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 

595 600 505 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 1975 
Sp Leu Thr Tyr Arg Ala Ser Thr Gly Phe Arg Leu Pro Ser 

TTT GCC GAA ATG TAT GGC TGG AGA GCC GGG GAG TCT TTG AAA ACG 2020 
£he Ala Glu Met Tyr Gly Trp Arg Ala Gly Glu Ser Leu Lys Thr 
625 630 3 

TTG GAT CTG AAA CCG GAA AAA TCC TTT AAT AGA GAG GCA GGT ATT 206S 
Leu Asp Leu Lys Pro Glu Lys Ser Phe Asn Arg Glu Ala Gly He 

GTA TTT AAA GGG GAC TTC GGC AAT TTG GAA GCC AGC TAT TTC AAC 2110 
Val Phe Lys Gly Asp Phe Gly Asn Leu Glu Ala Ser Tyr Phe Asn 
655 660 665 

AAT GCC TAT CGC GAC CTG ATT GCA TTC GGT TAT GAA ACC CGA ACT 2155 
Asn Ala Tyr Arg Asp Leu He Ala Phe Gly Tyr Glu Thr Arg Thr 
670 fi 75 bB0 

CAA AAC GGG CAA ACT TCG GCT TCT GGC GAC CCC GGA TAC CGA AAT 2200 
Gin Asn Gly Gin Thr Ser Ala Ser Gly Asp Pro Gly Tyr Arg Asn 
685 690 695 

GCC CAA AAT GCA CGC ATA GCC CGT ATC AAT ATT TTG GGT AAA ATC 2245 
Ala Gin Asn Ala Arg He Ala Gly He Asn He Leu Gly Lys He 
700 705 710 

GAT TGG CAC GGC GTA TGG GGC GGG TTG CCG GAC GGG TTG TAT TCC 2290 
Asp Trp His Gly Val Trp Gly Gly Leu Pro Asp Gly Leu Tyr Ser 

720 72b 



715 



ACG CTT GCC TAT AAC CGT ATC AAG GTC AAA GAT GCC GAT ATA CGC 2335 
Thr Leu Ala Tyr Asn Arg He Lys Val Lys Asp Ala Asp lie Arg 
730 735 7 

GCC GAC AGG ACG TTT GTA ACT TCA TAT CTC TTT GAT GCC GTC CAA 2380 
Ala Asp Arg Thr Phe Val Thr Ser Tyr Leu Phe Asp Ala Val Gin 
745 750 7 = 5 

CCT TCA CGA TAT GTA TTG GGT TTG GGT TAC GAC CAT CCT GAC GGA 2425 
So sS S Sr wll Leu Gly Leu Gly Tyr Asp His Pro Asp Gly 
760 76 5 770 

ATA TGG GGC ATC AAT ACG ATG TTT ACT TAT TCC AAG GCA AAA. TCT 2470 
ite Trp Gly lie Asn Thr Met Phe Thr Tyr Ser Lys Ala Lys Ser 
775 780 785 
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ACA TTT AGC TTG GAA ATG AAG TTT TAA ACGTCCAAAC GCCGCAAATG 2787 
Xhr Phe Ser Leu Glu Met Lys Phe 
880 



CCGTCTGAAA GGCT 



2801 
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SEQIDN0:3 

Objet : Sequence de I'ADN g6nomique de la souche de N. meningitidis IM2169 
codant pour le pr6curseur de la sous-unite Tbpl et sequence proteique ddduite. 
Le peptide signal est indique en caracferes gias. 

ATCAAGAATA AGGCTTCAGA 20 

CGGCATCGCT CCTTCCGATA CCGTCTGAAA GCGAAGATTA GGGAAACATT 70 

ATG CAA CAG GAA CAT TTG TTC CGA TTA AAT ATT TTA TGC CTG TCG 115 
Met Gin Gin Gin His Leu Phe Arg Leu Asn lie Leu Cys Leu Ser 
-24 -20 -15 -10 

CTG ATG ACT GCG CTG CCT GCT TAT GCA GAA AAT GTG CAA GCC GGA 160 
Leu Met Thr Ala Lau Pro Ala Tyr Ala Glu Asn Val Gin Ala Gly 
-5 -11 5 

CAA GCA CAG GAA AAA CAG TTG GAT ACC ATA CAG GTA AAA GCC AAA 205 
Gin Ala Gin Glu Lys Gin Leu Asp Thr lie Gin Val Lys Ala Lys 
10 15 20 

AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGT CTG GGC AAA 250 
Lys Gin Lys Thr Arg Arg Asp Asn Glu Val Thr Gly Leu Gly Lys 
25 30 35 

TTG GTC AAA ACC GCC GAC ACC CTC AGC AAG GAA CAG GTA CTC GAT 295 
Leu Val Lys Thr Ala Asp Thr Leu Ser Lys Glu Gin Val Leu Asp 
40 45 50 

ATC CGC GAC CTG ACG CGT TAC GAC CCC GGC ATC GCC GTG GTC GAA 340 
He Arg Asp Leu Thr Arg Tyr Asp Pro Gly He Ala Val Val Glu 
55 " " 60 65 

CAG GGG CGC GGC GCA AGT TCG GGC TAC TCG ATA CGC GGT ATG GAC 385 

Gin giy G1 y a 1 ** Ser Ser G1 y T y r Ser Ile Arg Gly Met Aap 

70 75 80 

AAA AAC CGC GTT TCC TTG ACG GTG GAC GGC TTG GCG CAA ATA CAG 430 
Lys Asn Arg Val Ser Leu Thr Val Asp Gly Leu Ala Gin lie Gin 
85 90 95 

TCC TAC ACC GCG CAG GCG GCA TTG GGC GGG ACG AGG ACG GCG GGC 475 
Ser Tyr Thr Ala Gin Ala Ala Leu Gly Gly Thr Arg Thr Ala Gly 
100 105 HO 

AGC AGC GGC GCA ATC AAT GAA ATC GAG TAT GAA AAC GTC AAA GCT 520 
Ser Ser Gly Ala Ile Asn Glu Ile Glu Tyr Glu Asn Val Lys Ala 
115 120 125 

GTC GAA ATC AGC AAA GGC TCA AAC TCG GTC GAA CAA GGC AGC GGC 565 
Val Glu He Ser Lys Gly Ser Asn Ser Val Glu Gin Gly Ser Gly 
130 135 140 
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GCA TTG GCG GGT TCG GTC GCA TTT CAA ACC AAA ACC GCC GAC GAT 600 
Ala Leu Ala Gly Ser Val Ala Phe Gin Tyr Lys Thr Ala Asp Asp 
145 150 155 

GTT ATC GGG GAA GGCAGG CAG TGG GGC ATT CAG AGT AAA ACC GCC 645 
Val He Gly Glu Gly Arg Gin Trp Gly He Gin Ser Lys Thr Ala 
160 165 170 

TAT TCC GGC AAA AAC CGG GGG CTT ACC CAA TCC ATC GCG CTG GCG 
Tvr Ser Gly Lys Asn Arg Gly Leu Thr Gin Ser lie Ala Leu Ala 
1 --- " 180 I8 5 



175 



CCG GGT TTT CGT TXT uAA aau wift *-wx w ™ " 

Pro Gly Phe Arg Phe Glu Asn Lys Arg His Tyr He Gly Gly He 
300 305 



690 



GGG CGC ATC GGC GGT GCG GAG GCT TTG CTG ATC CAC ACC GGG CGG 735 
Glv Aro He Gly Gly Ala Glu Ala Leu Leu He His Thr Gly Arg 
1 * 190 195 200 

CGC GCG GGG GAA ATC CGC GCA CAC GAA GAT GCC GGA CGC GGC GTT 780 
Arg Ala Gly Glu He Arg Ala His Glu Asp Ala Gly Arg Gly Val 
205 210 215 

CAG AGC TTT AAC AGG CTG GTG CCG GTT GAA GAC AGC AGC GAA TAC 825 
Gin Ser Phe Asn Arg Leu Val Pro Val Glu Asp Ser Ser Glu Tyr 
220 225 230 

GCC TAT TTC ATC GTT GAA GAT GAA TGC GAA GGC AAA AAT TAC GAA 870 
Ala Tyr Phe He Val Glu Asp Glu Cys Glu Gly Lys Asn Tyr Glu 
235 240 245 

ACG TGT AAA AGC AAA CCG AAA AAA GAT GTT GTC GGC AAA GAC GAA 915 
Thr Cys Lys Ser Lys Pro Lys Lys ASp Val Val Gly Lys Asp Glu 
250 255 260 

CGT CAA ACG GTT TCC ACC CGA GAC TAC ACG GGC CCC AAC CGC TTC 960 
Arg Gin Thr Val Ser Thr Arg Asp Tyr Thr Gly Pro Asn Arg Phe 
265 270 275 

CTC GCC GAT CCG CTT TCA TAC GAA AGC CGA TCG TGG CTG TTC CGC 1005 
Leu Ala Asp Pro Leu Ser Tyr Glu Ser Arg Ser Trp Leu Phe Arg 
280 285 290 

CCG GGT TTT CGT TTT GAA AAC AAA CGG CAC TAC ATC GGC GGC ATA 1050 
Arg *" " " ' " " * " 

295 

CTC GAA CAC ACG CAA CAA ACT TTC GAC ACG CGC GAT ATG ACG GTT 1095 
Leu Glu His Thr Gin Gin Thr Phe Asp Thr Arg Asp Met Thr Val 
310 315 320 

CCG GCA TTC CTG ACC AAG GCG GTT TTT GAT GCA AAT TCA AAA CAG 1X40 
Pro Ala Phe Leu Thr Lys Ala Val Phe Asp Ala Asn Ser Lys Gin 
325 330 335 

GCG GGt TCT TTG CCC GGC AAC GGC AAA TAC GCG GGC AAC CAC AAA 1185 
Ala Gly Ser Leu Pro Gly Asn Gly Lys Tyr Ala Gly Asn His Lys 
340 345 350 

TAC GGC GGA CTG TTT ACC AAC GGC GAA AAC GGT GCG CTG GTG GGC 1230 
Tyr Gly Gly Leu Phe Thr Asn Gly Glu Asn Gly Ala Leu Val Gly 
355 360 365 

GCG GAA TAC GGT ACG GGC GTG TTT TAC GAC GAG ACG CAC ACC AAA 1275 
Ala Glu Tyr Gly Thr Gly Val Phe Tyr Asp Glu Thr His Thr Lys 
370 375 380 
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AGC CGC TAG GGT TTG GAA TAT GTC TAT ACC AAT GCC GAT AAA GAC 1320 
Ser Arg Tyr Gly Leu Glu Tyr Val Tyr Thr Asn Ala Asp Lys Asp 
385 390 395 

ACT TGG GCG GAT TAT GCC CGC CTC TCT TAC GAC CGG CAG GGC ATC 1365 
Thr Trp Ala Asp Tyr Ala Arg Leu Ser Tyr Asp Arg Gin Gly He 
400 405 410 

GGT TTG GAC AAT CAT TTT CAG CAG ACG CAC TGT TCT GCC GAC GGT 1410 
Gly Leu Asp Asn His Phe Gin Gin Thr His Cys Ser Ala Asp Gly 
415 420 425 

TCG GAC AAA TAT TGC CGC CCG AGT GCC GAC AAG CCG TTT TCC TAT 1455 
Ser Asp Lys Tyr Cys Arg Pro Ser Ala Asp Lys Pro Phe Ser Tyr 
430 435 440 

TAC AAA TCC GAC CGC GTG ATT TAC GGG GAA AGC CAC AGG CTC TTG 1500 
Tyr Lys Ser Asp Arg Val He Tyr Gly Glu ser His Arg Leu Leu 
445 450 455 

CAG GCG GCA TTC AAA AAA TCC TTC GAT ACC GCC AAA ATC CGC CAC 1545 
Gin Ala Ala Phe Lys Lys Ser Phe Asp Thr Ala Lys He Arg His 
460 465 470 

AAC CTG AGC GTG AAT CTC GGG TTT GAC CGC TTT GAC TCT AAT CTC 1590 
Asn Leu Ser Val Asn Leu Gly Phe Asp Arg Phe Asp Ser Asn Leu 
475 480 485 

CGC CAT CAG GAT TAT TAT TAT GAA CAT GCC AAC CGC GCC TAT TCG 1635 
Arg His Gin Asp Tyr Tyr Tyr Gin His Ala Asn Arg Ala Tyr Ser 
490 495 500 

TCG AAA ACG CCC CCT AAA ACC GCC AAC CCC AAC GGC GAC AAG AGC 1680 
Ser Lys Thr Pro Pro Lys Thr Ala Asn Pro Asn Gly Asp Lys Ser 
505 510 515 

AAA CCC TAT TGG GTC AGC ATA GGC GGG GGA AAT GTG GTT ACG GGG 1725 
Lys Pro Tyr Trp Val Ser He Gly Gly Gly Asn Val Val Thr Gly 
520 525 530 

CAA ATC TGC CTC TTT GGC AAC AAT ACT TAT ACG GAC TGC ACG CCG 1770 
Gin He Cys Leu Phe Gly Asn Asn Thr Tyr Thr Asp Cys Thr Pro 
535 540 545 

CGC AGC ATC AAC GGC AAA AGC TAT TAC GCG GCA GTT CGG GAC AAT 1815 
Arg Ser He Asn Gly Lys Ser Tyr Tyr Ala Ala Val Arg Asp Asn 
550 555 560 

GTC CGT TTG GGC AGG TGG GCG GAT GTC GGC GCG GGG TTG CGC TAC 1860 
Val Arg Leu Gly Arg Trp Ala Asp Val Gly Ala Gly Leu Arg Tyr 
565 570 575 

GAC TAC CGC AGC ACG CAT TCG GAC GAC GGC AGC GTT TCC ACC GGC 1905 
Asp Tyr Arg Ser Thr His Ser Asp Asp Gly Ser Val Ser Thr Gly 
580 585 590 

ACG CAC CGC ACC CTG TCC TGG AAC GCC GGC ATC GTC CTC AAA CCT 1950 
Thr His Arg Thr Leu Ser Trp Asn Ala Gly He Val Leu Lys Pro 
595 600 605 

GCC GAC TGG CTG GAT TTG ACT TAC CGC ACT TCA ACC GGC TTC CGC 1995 
Ala Asp Trp Leu Asp Leu Thr Tyr Arg Thr Ser Thr Gly Phe Arg 
610 615 620 
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CTG CCC TCG TTT GCG GAA ATG TAC GGC TGG CGG TCG GGT GTT CAA 2040 
Leu Pro Ser Phe Ala Glu Met Tyr Gly Trp Arg Ser Gly Val Gin 
625 630 «5 

AGC AAG GCG GTC AAA ATC GAT CCG GAA AAA TCG TTC AAC AAA GAA 2095 
Ser Lye Ala Val Lys He Asp Pro Glu Lys Ser Phe Asn Lys Glu 
640 645 650 

GCC GGC ATC GTG TTT AAA GGC GAT TTC GGC AAC TTG GAG GCA AGT 2130 
Ala Gly lie Val Phe Lys Gly Asp Phe Gly Asn Leu Glu Ala Ser 
655 660 665 

TGG TTC AAC AAT GCC TAC CGC GAT TTG ATT GTC CGG GGT TAT GAA 2175 
Trp Phe Asn Asn Ala Tyr Arg Asp Leu He Val Arg Gly Tyr Glu 
670 675 680 

GCG CAA ATT AAA AAC GGC AAA GAA GAA GCC AAA GGC GAC CCG GCT 2220 
Ala Gin He Lys Asn Gly Lys Glu Glu Ala Lys Gly Asp Pro Ala 
685 690 695 

TAC CTC AAT GCC CAA AGC GCG CGG ATT ACC GGC ATC AAT ATT TTG 2265 
Tyr Leu Asn Ala Gin Ser Ala Arg He Thr Gly He Asn He Leu 
700 705 710 

GGC AAA ATC GAT TGG AAC GGC GTA TGG GAT AAA TTG CCC GAA GGT 2310 
Gly Lys He Asp Trp Asn Gly Val Trp Asp Lys Leu Pro Glu Gly 
715 720 725 

TGG TAT TCT ACA TTT GCC TAT AAT CGT GTC CAT GTC CGC GAC ATC 2355 
Trp Tyr Ser Thr Phe Ala Tyr Asn Arg Val His Val Arg Asp He 
730 ~ 735 740 

AAA AAA CGC GCA GAC CGC ACC GAT ATT CAA TCA CAC CTG TTT GAT 2400 
Lys Lys Arg Ala Asp Arg Thr Asp He Gin Ser His Leu Phe Asp 
745 750 755 

GCC ATC CAA CCC TCG CGC TAT GTC GTC GGC TTG GGC TAT GAC CAA 2445 
Ala He Gin Pro Ser Arg Tyr Val Val Gly Leu Gly Tyr Asp Gin 
760 765 770 

CCG GAA GGC AAA TGG GGT GTG AAC GGT ATG CTG ACT TAT TCC AAA 2490 
Pro Glu Gly Lys Trp Gly Val Asn Gly Met Leu Thr Tyr Ser Lys 
775 780 785 

GCC AAG GAA ATC ACA GAG TTG TTG GGC AGC CGG GCT TTG CTC AAC 2535 
Ala Lys Glu He Thr Glu Leu Leu Gly Ser Arg Ala Leu Leu Asn 
J 795 800 



790 



GGC AAC AGC CGC AAT ACA AAA GCC ACC GCG CGC CGT ACC CGC CCT 2580 
Gly Asn Ser Arg Asn Thr Lys Ala Thr Ala Arg Arg Thr Arg Pro 
805 810 • 815 

TGG TAT ATT GTG GAT GTG TCC GGT TAT TAC ACG ATT AAA AAA CAC 2625 
Trp Tyr He Val Asp Val Ser Gly Tyr Tyr Thr He Lys Lys His 
820 825 830 

TTC ACC CTC CGT GCG GGC GTG TAC AAC CTC CTC AAC TAC CGC TAT 2670 
Phe Thr Leu Arg Ala Gly Val Tyr Asn Leu Leu Asn Tyr Arg Tyr 
835 840 845 

GTT ACT TGG GAA AAT GTG CGG CAA ACT GCC GGC GGC GCA GTC AAC 2715 
Val Thr Trp Glu Asn Val Arg Gin Thr Ala Gly Gly Ala Val Asn 
850 855 860 
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CAA CAC AAA AAT GTC GGC GTT TAC AAC CGA TAT GCC GCC CCC GGC 2760 
Gin His Lys Asn Val Gly Val Tyr Asn Arg Tyr Ala Ala Pro Gly 
865 870 875 

CGA AAC TAC ACA TTT AGC TTG GAA ATG AAG TTT TAA ACG 2799 
Arg Asn Tyr Thr Phe Ser Leu Glu Met Lys Phe 
880 885 



2692592 



-41 - 



194 



239 



SEP ID NO : 4 

Objet : Sequence de l'ADN genomique de la souche de N. meningitidis IM2169 
' codant pour Ieprecurseurde la sous-unite^ 
Le peptide signal est indique en caractere gras. 

ATTTGTTAA AAATAAATAA AATAATAATC CTTATCATTC TTTAATTGAA TTGGGTTTAT 59 

ATG ARC AAT CCA TTG 6TA AAT CAG GCT GCT ATG GTG CTG CCT GTG 104 
iSt Sn Ann Pro LeuVal Asn Gin Ala Ala Met Val Leu Pro Val 
-20 -15 -10 

TTT TTG TTG AGT GCC TGT CTG GGC GGC GGC GGC AGT TTC GAT CTT 149 
Phe Leu Lea Ser Ala Cys Leu Gly Gly Gly Gly Ser Phe Asp Leu 
-5 -11 5 10 

GAT TCT GTC GAT ACC GAA GCC CCG CCT CCC GCG CCA AAG TAT CAA 
Asp Ser Val Asp Thr Glu Ala Pro Arg Pro Ala Pro Lys Tyr Gin 
15 20 

GAT GTT TCT TCC GAA AAA CCG CAA GCC CAA AAA GAC CAA GGC GGA 
Asp Val Ser Ser Glu Lys Pro Gin Ala Gin Lys Asp Gin Gly Gly 
30 35 • 4U 

TAC GGT TTT GCG ATG AGG TTG AAA CGG AGG AAT TGG TAT CCG GGG 284 
Tyr Gly Phe Ala Met Arg Leu Lys Arg Arg Asn Trp Tyr Pro Gly 
* 45 50 55 

GCA GAA GAA AGC GAG GTT AAA CTG AAC GAG AGT GAT TGG GAG GCG 329 
Ala Glu Glu Ser Glu Val Lys Leu Asn Glu Ser Asp Trp Glu Ala 

eo 65 70 

ACG GGA TTG CCG ACA AAA CCC AAG GAA CTT CCT AAA CGG CAA AAA 374 
Thr Gly Leu Pro Thr Lys Pro Lys Glu Leu Pro Lys Arg Gin Lys 
* 75 80 85 

ICG GTT ATT GAA AAA GTA GAA ACA GAC GGC GAC AGC GAT ATT TAT 
Ser Val lie Glu Lys Val Glu Thr Asp Gly Asp Ser Asp lie Tyr 
90 95 1°° 

TCT TCC CCC TAT CTC ACA CCA TCA AAC CAT CAA AAC GGC AGC GCT 
Ser Ser Pro Tyr Leu Thr Pro Ser Asn His Gin Asn Gly Ser Ala 
105 HO 11 

GGC AAC GGT GTA AAT CAA CCT AAA AAT CAG GCA ACA GGT CAC GAA 509 
Gly Asn Gly Val Asn Gin Pro Lys Asn Gin Ala Thr Gly His Glu 
120 I 25 1 

AAT TTC CAA TAT GTT TAT TCC GGT TGG TTT TAT AAA CAT GCA GCG 
Asn Phe Gin Tyr Val Tyr Ser Gly Trp Phe Tyr Lys His Ala Ala 
135 140 J-** 3 

AGT GAA AAA GAT TTC AGT AAC AAA AAA ATT AAG TCA GGC GAC GAT 
Ser Glu Lys Asp Phe Ser Asn Lys Lys lie Lys Ser Gly Asp Asp 
150 155 lbu 



419 



464 



554 



599 
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GGT TAT ATC TTC TAT CAC GGT GAA AAA CCT TCC CGA CAA CTT CCT 644 
Gly Tyr He Phe Tyr His Gly Glu Lys Pro Ser Arg Gin Leu Pro 
165 170 175 

GCT TCT GGA AAA GTT ATC TAC AAA GGT GTG TGG CAT TTT GTA ACC 689 
Ala Ser Gly Lya Val lie Tyr Lys Gly Val Trp Hia Phe Val Thr 
180 185 190 

GAT ACA AAA AAG GGT CAA GAT TTT CGT GAA ATT ATC CAG CCT TCA 734 
Asp Thr Lys Lys Gly Gin Asp Phe Arg Glu He He Gin Pro Ser 
195 200 205 

AAA AAA CAA GGC GAC AGG TAT AGC GGA TTT TCT GGT GAT GGC AGC 779 
Lys Lys Gin Gly Asp Arg Tyr Ser Gly Phe Ser Gly Asp Gly Ser 
* J 210 215 220 

GAA GAA TAT TCC AAC AAA AAC GAA TCC ACG CTG AAA GAT GAT CAC 824 
Glu Glu Tyr Ser Asn Lys Asn Glu Ser Thr Leu LyB Asp Asp His 
225 230 235 

GAG GGT TAT GGT TTT ACC TCG AAT TTA GAA GTG GAT TTC GGC AAT 869 
Glu Gly Tyr Gly Phe Thr Ser- Asn Leu Glu Val Asp Phe Gly Asn 
240 245 250 

AAG AAA TTG ACG GGT AAA TTA ATA CGC AAT AAT GCG AGC CTA AAT 914 
Lys Lys Leu Thr Gly Lys Leu He Arg Asn Asn Ala Ser Leu Asn 
J 255 260 265 

AAT AAT ACT AAT AAT GAC AAA CAT ACC ACC CAA TAC TAC AGC CTT 959 
Asn Asn Thr Asn Asn Asp Lys His Thr Thr Gin Tyr Tyr Ser Leu 
270 275 280 

GAT GCA CAA ATA ACA GGC AAC CGC TTC AAC GGC ACG GCA ACG GCA 1004 
Asp Ala Gin He Thr Gly Asn Arg Phe Asn Gly Thr Ala Thr Ala 
285 290 295 

ACT GAC AAA AAA GAG AAT GAA ACC AAA CTA CAT CCC TTT GTT TCC 1049 
Thr Asp Lys Lys Glu Asn Glu Thr Lys Leu His Pro Phe Val Ser 
300 305 310 

GAC TCG TCT TCT TTG AGC GGC GGC TTT TTC GGC CCG CAG GGT GAG 1094 
Asp Ser Ser Ser Leu Ser Gly Gly Phe Phe Gly Pro Gin Gly Glu 
315 320 325 

GAA TTG GGT TTC CGC TTT TTG AGC GAC GAT CAA AAA GTT GCC GTT 1139 
Glu Leu Gly Phe Arg Phe Leu Ser Asp Asp Gin Lys Val Ala Val 
330 335 340 

GTC GGC AGC GCG AAA ACC AAA GAC AAA CTG GAA AAT GGC GCG GCG 1184 
Val Gly Ser Ala Lys Thr Lys Asp Lys Leu Glu Asn Gly Ala Ala 
345 350 355 

GCT TCA GGC AGC ACA GGT GCG GCA GCA TCG GGC GGT GCG GCA GGC 1229 
Ala Ser Gly Ser Thr Gly Ala Ala Ala Ser Gly Gly Ala Ala Gly 
360 365 370 

ACG TCG TCT GAA AAC AGT AAG CTG ACC ACG GTT TTG GAT GCG GTT 1274 
Thr Ser Ser Glu Asn Ser Lys Leu Thr Thr Val Leu Asp Ala Val 
375 380 385 

GAA TTG ACA CTA AAC GAC AAG AAA ATC AAA AAT CTC GAC AAC TTC 1319 
Glu Leu Thr Leu Asn Asp Lys Lys He Lys Asn Leu Asp Asn Phe 
390 395 400 
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*ec ART GCC GCC CRA CTG GTT GTC GAC GGC ATT ATG ATT CCG CTC 
Ser Jsn a£ a£ G?n Leu Val Val Asp 01, He Met He Pro Leu 
405 410 HA3 



1364 



CTG CCC AAG GAT TCC GAA AGO GGG AAC ACT CAG GCA GAT AAA GOT 1409 
Eeu Pro Lys Aep Ser Gl« Ser Gly Aen Thr Gin Ala Asp Lys Gly 
420 425 *» JW 

AAA AAC GGC GGA ACA GAA TTT ACC CGC AAA TTT GAA CAC ACG CCG 
Lys Ann Gly Gly Thr Glu Phe Thr Arg Lys Phe Glu His Thr Pro 
J 435 440 

GAA AGT GAT AAA AAA GAC GCC CAA GCA GGT ACG CAG ACG AAT GGG 
G iu Ser S Lys Lys Asp Ala Gin Ala Gly Thr Gin Thr Asn Gly 



450 



GCG CAA ACC GCT TCA AAT ACG GCA GGT GAT ACC AAT GGC AAA ACA 
S Sn Jar aS ser Asn Thr Ala Gly Asp Thr Asn Gly Lys Thr 
465 470 

Ajva Arc TAT GAA GTC GAA GTC TGC TGT TCC AAC CTC AAT TAT CTG 
£ £ Sr gS v£ Glu Val Cys Cys Ser Asn Leu Asn Tyr Leu 
480 485 

AAA TAC GGA ATG TTG ACG CGC AAA AAC AGC AAG TCC GCG ATG CAG 
Tyr Gly Met Leu Thr Arg Lys Asn Ser Lys Ser Ala Met Gin 
J 495 500 JWJ 

CCA GGA GGA AAC AGT AGT CAA GCT GAT GCT AAA ACG GAA CAA GTT 
aS S 5 ^n Ser Ser Gin Ala Asp Ala Lys Thr Gin Gin Val 

510 515 
GAA CAA AGT ATG TTC CTC CAA GGC GAG CGT ACC GAT GAA AAA GAG 
525 



PAA CAA AGT ATG TTC CTC CAA ****** ™" 1 "~ 

Ser Set Phe Leu Gin Gly Glu Arg Thr Asp Glu Lys Glu 

ATT CCA ACC GAC CAA AAC GTC GTT TAT CGG GGG TCT TGG TAC GGG 
S pS ?Sr Asp gS Asn Val Val Tyr Arg Gly Ser Trp Tyr Gly 
540 545 

CAT ATT GCC AAC GGC ACA AGC TGG AGC GGC AAT GCT TCT GAT AAA 
Ss S Ala Asn Gly Thr Ser Trp Ser Gly Asn Ala Ser Asp Lys 

GAG GGC GGC AAC AGG GCG GAA TTT ACT GTG AAT TTT GCC GAT AAA 
Glu Gly Gly Asn Arg Ala Glu Phe Thr Val Asn Phe Ala Asp Lys 
570 575 

AAA ATT ACC GGC AAG TTA ACC GCT GAA AAC AGG CAG GCG CAA ACC 
JJs S Thr Gly Lys Leu Thr Ala Glu Asn Arg Gin Ala Gin Thr 
585 590 

TTT ACC ATT GAG GGA ATG ATT CAG GGC AAC GGC TTT GAA GGT ACG 
Phe Thr He Glu Gly Met He Gin Gly Asn Gly Phe Glu Gly Thr 
600 605 

GCG AAA ACT GCT GAG TCA GGT TTT GAT CTC GAT CAA AAA AAT A CC 
Ala Lys Thr Ala Glu Ser Gly Phe Asp Leu Asp Gin Lys Asn Thr 
615 620 

ACC CGC ACG CCT AAG GCA TAT ATC ACA GAT GCC AAG GTA AAG GGC 
Thr Arg Thr Pro Lys Ala Tyr lie Thr Asp Ala Lys Val Lys ey 
630 bJ3 



1454 



1499 



1544 



1589 



1634 



1679 



1724 



1769 



1814 



1859 



1904 



1949 



1994 



2039 
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GGT TTT TAC GGC CCT AAA GCC GAA GAG TTG GGC GGA TGG TTT GCC 2084 
Gly Phe Tyr Gly Pro Lys Ala Glu Glu Leu Gly Gly Trp Phe Ala 
645 650 655 

TAT COG GGC GAT AAA CAA ACG GAA AAG GCA ACA GCT ACA TCC AGC 2129 
Tyr Pro Gly Asp Lys Gin Thr Glu Lys Ala Thr Ala Thr Ser Ser 
660 665 670 

GAT GGA AAT TCA GCA AGC AGC GCG ACC GTG GTA TTC GGT GCG AAA 2174 
Asp Gly Asn Ser Ala Ser Ser Ala Thr Val Val Phe Gly Ala Lys 
675 680 685 

CGC CAA CAG CCT GTG CAA TAA GCACGGTTGC CGAACAATCA AGAATAAGGC 2225 
Arg Gin Gin Pro Val Gin 
690 



TTCAG 



2230 
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Rftvftnttications 

L Un fragment d'ADN isole codant pour un peptide, un polypeptide ou 
une prot6ine capables d'etre reconnus par un antiserum anti-recepteur 
de la transferrine de la souche de N. meningitidis IM2394 on IM2169. 

2 Un fragment d'ADN selon la revendication 1, qui comprend une 
sequence nucleotidique codant pour une sequence d'acides amines 
homologue a celle telle que montr6e : 

- dans le SEQ ID NO : 1, commencant avec le residu cyst6ine en position 
1 et finissant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : 2, commencant avec le residu acide glutamique 
en position 1 et finissant avec le residu ph6nylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commencant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 887 ; 

oa . . 

- dans le SEQ ID NO : 4, commencant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 691. 

3 Un fragment d'ADN selon la revendication 2, qui comprend une 
sequence nucl6otidique codant pour une sequence d'acides amines telle 
que montree : 

- dans le SEQ ID NO: 1, commencant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : % commencant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ED NO : 3, commencant avec le residu acide glutamique 
en position 1 et finissant avec le r6sidu phenylalanine en position 887 ; 



ou 
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- dans le SEQ ID NO : 4, commengant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 691. 

Un fragment d'ADN selon la revendication 2, qui a une sequence 
nucleotidique codant pour une proteine ayant une sequence d'acides 
amines homoiogue k celle telle que montree : 

- dans le SEQ ED NO : 1, commengant avec le residu cysteine en position 
1 et finiss ant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : 2, commengant avec le residu acide ghitamique 
en position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commengant avec le residu acide ghitamique 
en position 1 et finissant avec le residu phenylalanine en position 887 ; 
ou 

- dans le SEQ ID NO : 4, commengant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 691. 

Un fragment d'ADN selon la revendication 4 , qui a une sequence 
nucteotidique codant pour : 

i) la sous-unite Tbpl de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 2, commengant avec le 
r6sidu acide ghitamique en position 1 et finissant avec le residu 
phenylalanine en position 884 ; 

ii) la sous-unite Tbp2 de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 1, commengant avec le 
residu cysteine en position 1 et finissant avec le residu glutamine en 
position 579 ; 

iii) la sous-unite Tbpl de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 3, commengant avec le 
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residu acide glutamique en position 1 et finissant avec le residu 
phenylalanine en position 887 ; ou 

iv) la sous-unite Tbp2 de la souche EM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 4, commengant avec le 
residu cysteine en position 1 et finissant avec le residu glutamine en 
position 691. 

6. Un fragment d'ADN selon la revendication 2, qui a une sequence 
nucteotidique codant pom: un precurseur ayant une s6quence d'acides 
amines homologue h celle telle que montree : 

- dans le SEQ ID NO : 1, commengant avec le r6sidu methionine en 
position -20 et finissant avec le residu glutamine en position 579 ; 

- dans le SEQ ED NO : 2, commengant avec le r6sidu methionine en 
position -24 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commengant avec le residu methionine en 
position -24 et finiss ant avec le residu phenylalanine en position 887 ; 
ou 

- dans le SEQ ID NO : 4, commengant avec le r&idu methionine en 
position -20 et finissant avec le residu glutamine en position 691. 

7. Un fragment d'ADN selon L'une des revendications 1 et 2, 
qui a une sequence nucl§otidique codant pour : 

i) Le precurseur de la sous-unit^ Tbpl de la souche IM2394 dont la 
sequence en acides amines est montr6e dans le SEQ ID NO : 2, 
commengant avec le r&idu methionine en position -24 et finissant 
avec le r6sidu phenylalanine en position 884 ; 

ii) Le precurseur de la sous-unitd Tbp2 de la souche IM2394 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 1, 
commengant avec le r&idu methionine en position -20 et finissant 
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avec le residu glutamine en position 579 ; 

iii) Le precurseur de la sous-unite Tbpl de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 3, 
commen$ant avec le residu methionine en position -24 et finissant 
avec le residu phenylalanine en position 887 ; ou 

•iv) Le precurseur de la sous-unite Tbp2 de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 4, 
commengant avec le residu methionine en position -20 et finissant 
avec le residu glutamine en position 691. 

8. Une cassette d'expression destinge & la production d'une prot&ne 
capable d'etre reconnue par un antiserum anti-r6cepteur de la 
transferrine de la souche de K meningitidis IM2394 ou IM2169, qui 
comprend un fragment d'ADN selon Tune des revendications 1 k 7, place 
sous le controle des elements necess aires k son expression, 

9. Une cellule-hote transform^ par une cassette d'expression selon la 
revendication 8. 

10. Un proc6d6 de production d'une proteine capable d'etre reconnue par un 
antiserum anti-recepteur de la transferrine de la souche de N. 
meningitidis IM2394 ou EM2169, qui comprend Tacte de cultiver une 
cellule-hote selon la revendication 9. 

11. Un bloc d'ADN isole codant pour un peptide signal ayant une sequence 
d'acides amines homologue a celle telle que montr£e dans : 

- le SEQ ID NO : 2, commen$ant avec le residu methionine en 
position - 24 et finissant avec le residu en position - L 

le SEQ ED NO : 3, commen§ant avec le r&idu methionine en 
position - 24 et finissant avec le residu alanine en position - 1 ; et 

le SEQ ID NO : 4, commengant avec le residu methionine en 
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position - 20 et finissant avec le residu alanine en position - L 

12. Un bloc d'ADN isoi6 codant pour un peptide signal ayant une sequence 
d'acides amines telle que montr6e dans : 

le SEQ ID NO : 2, commengant avec le residu methionine en 
position - 24 et finissant avec le r6sidu en position - 1 ; 

- le SEQ ID NO : 3, commengant avec le r6sidu methionine en 
position - 24 et finissant avec le residu alanine en position - 1 ; et 

' - . le SEQ ID NO : 4, coramengant avec le residu methionine en 
position - 20 et finissant avec le r6sidu alanine en position - 1. 
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Tbpl -2394 MQQQHI^lU^fclILCZ£LMTAL2VYAEWQAEQAQEXQII)T^^ 

Tbpl -21 69 MQQQKLFRLN riCLSI^iTAI^ AYAENVQAGQAOEKQLDTIQ VKAiCKQKTHHDNEVTGLGK 

» wwwww ww wwwww w www* ^ w www www www ww ww www* ww»» w www ww w 

Tbpl -239 4 LVKSSDTL5KEQVI^I3U)LTRYDPGIAVVEQOT 

Tbpl -2 1 59 LV7CTADTL5KEQVLD IRDLTR YDPG IAWEQGRGASSGYS IRGMDKNRVSLTVDGLAQIQ 

Tbp 1-2394 SYTAQAALGGTRTAGSSGAI*reiEYENVKAVEIS^^ 
Tbpl -21 69 SYTAQAXLGGTRTAGSSGAINEIZTiSfVKAVEISX^ 

TVVyVVVVVTTVVVTTVVVt*VVVrT*VV«TT*VVV*TT W V W W W W W W W W W W W W W W W 

Tbp 1-2394 r IGEGXOWGlQSXTAYSGXDKALTQSIJklAGRSG^ 

Tbpl -21 69 VTGEGaQWGIQSXTAYSGKNRGLTQSIAlAGRIGGAEAIJ.IHTGRRAGEIRAHEDAGRGV 

WWWW WWWW WWWWWWWWW WW WWWWW WWWWWWWW W WW WW WW WW ww 

• * • * • • 

Tbpl -2394 QScNRLVUJEDKXZGGSQYRYrlVEEZ^ 

Tbpl -21 69 QSrMRiVPVKD SSEYAYFIVcD ECEGKNYETCXSKPKKD WGXDERQTVSTRD YTG 

t~w -w— -w -w -WW w W WWWWWWWW W *« * W W WWWW WWWW WWWW 

Tbpl -2394 3^ftlIXANPLEYGSQSWLFRPGWKL0N-RHYVGAVT^^ 
Tbpl -21 69 PNRFIJ^PLSY£5RSVLFRPC^RFa*KRHY^ 

WW WW WW W W WWWWWWW . W WWW ^ » ^ # WW WW WW WW WWWWWWWW W 

Tbpl -2394 GSIiCGLGXYSGDNKAERI^WEGSTI^ 

Tbp 1 -2 1 69 NSKQAGSLPGNGXYAGNKKYGGLFTNGZNGALVGAEYGTGV^ 

www w www w w ww ^ ww v w wwwwwwwww www www wwww w 

Tbp 1-2394 ADKDTWAD YARLS YDRQG IDIX)NRLQOTHCSKDGSOKNCRPOGNKP YSTYKSDRMIYEES 

Tbpl -21 69 AD KDTVAD YARLS YD RQG IGLD tfHFQQTHCSADGSD KYCRP SADKPF SYYKSDR VTYGHS 

Tbpl -2394 . RKLF QAVFKKAFDTAXI RHJiLS Ii^LG YDRFXSQLSHSD YYLQNAVQAYDI*XTP KXPPFPN 

Tbp t - 2 1 69 HRLWAAFXKSFDTAKIRKNLSVNIXiFDRFDSNIi^QOYYY^ 

W WW WWW WWWWWWWWWW WWW WWW WWW WWW W W WW WW W WW 

Tbpl - 2394 GSKDNP YRVSIGXTTVNTSP ICRFGNNTYTDCTP RKTGGMGYYAAVQONVRX^IRWAD VGA 

Tbpl -21 69 GDKSXPYWVSIGGGNVVTCQIO^GtMNT^^ 

♦ » WW WWWW W W WW WW WWWWWWWWW W W w * WWWW WWWWWWWW WWWW w 
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Tbol -2394 G IRYD YRSTHSED KSVSTCTKR^^^SWNAGVVIJCP S^TWMDLTYRASTGFRLP SF AEMY GWR 

Tbpt -21 69 C^TOYKSTHSDCXSVSTGTHRTLSWNAGIVI^AD 

Tbol -2394 agESTJCETJOIOTEKSF^^ 

Tbp1 -21 69 SGVOSKAVKTOPEXScTCCi^^ 

Tbp1 -2394 GDPGYRNAQ5iARIAGIJriLGKIDWHGWGGLPOGLySTIAyNR 

Tbol -21 69 GOPAYLNAQSARITGIN ILGXID WGVWDKLPEGWYSTFAYNRVHVRDIXXRADRTD IQS 

v •»» ».* ***** - * 

Tbpl-2394 AAPGRNYTFSLEMKF 
Tbpl-2169 AAPGRNYTFSLEHXF 

w w » » «w w » « -www tr -v ■» » 

» =» acide amin.6 identique 
. =changement cooservatif 
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~bo2-2394 CZ.GGGG3ET) LOSV^TVCCMKSXPKYHDEIKSQ-?ESQQOVSENSGAAYGFAVKI^R^AHF 

7bo2-21 69 CLGGGGSFO!^SVDT-EA?RPA?KYQOVS3EXPQA0KD QG -GYGF AMRI*XRRN W 

» w w-v w w-v «■ WW v » w » » ■*■ _ » # 

~bD2-2394 N?XYXEXKX?LG3MDWKXLQ""HGE?NSFSERDE — LEXXR-- G S5E-LIE3XWED 

Tbo2-2 1 69 : ^GAH£SE7^<r-NHSDWT^ 

Tbo2-2394 G Q — SRWGYTNFTYVRSGYVYI^K-NNXDIKNNIVt^GPOGYLYYXGXEPSK 

Tbo2-21 69 • GSAGNGVNQPKNQATGKE^QWYSGWFYKHAASZXDFSNKKIKSGDDGYIFYHGEKPSR 

Thn2-2394 EXP - SEXITYXGTVD YVTD AMEXQRF -EG — G3AAGG0 KSG ALSALEEGVLRNQ AEAS — 

Tbp2-21 69 QLPASGXVr/XGVWKFVT^ 

Tbo2-2394 5GHTD FGKTSEFEVD FSDKT IXG7L YRNNR ITQNNSENXQ IXTTRYTIQATLHGNRFXGK 

Tho2-2 1 69 doHECYGFSSHLEVDFGNKXLTGXIJCRNNASI^^ 

Tbo2-2394 ALAADKaCWGS-KPFISDSDSIEK^ 

Tbp2-21 69 ATATDKXENETKIi£?FVS0SS3ISGGFF 

Thn2-2394 =N AAGPAIE TVXOAYRITG3HFKXEQIDSFGDVKKLI.VDGVE 

Tbo2-2169 <yuWSGSOTUWSGCHUK?=SS^ 

T h n2- 2394 LSLLPSEGNTCAA- FQHZIZ QNGVKAT 

Tbo2-21 69 7 ?LL? KDSE5G NTQAO KGXNGGTEFTRKFEHTPESDKXDAQAGTQTNGAQTASNTAG DTN 
. ~' ^ . * * * 

Tbo2-2394 VCCSNLDYMSFGKL5XEN-K ■ DDMFLQGVRTP 

~ho2-21 69 GXTKTVSVEVCCSHItfYIJttC^ 



Tbo2-2394 vSOVAARTEANAICfilGTWYGYIANGTSWSGEASNQEGGNRAEFOVDFSTXKI 
Tbp2-2169 EXE IP — TDQNVVYRGSWYGHIANGTSWSGNASDKEGGNRAExTTOF 



T w D 2-2394 RTSPAFT1TAMIKE>NGFSGVAKTCENGFAIJ>PQNTGNSHYTHI - EATVSGGFYGKNAIEM 

Tbp2-21 69 RQAQTFTIHGMIQGNGFEGTAKTAESGFOL^KNTTRTPKAY * T - > ^ K ^^^^ PK ^^* 

7bo2-2394 GGSFSFPGNAPEGXQE XASWFGAKRQQLVQ 

Tbp2-21 69 GGWFAYPGDKQTEXATATS3DGNSASSATWFGAKRQQPVQ 



* = acide amin6 idencique 
. = chanqement conservatif 
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